Hace 10 años | Por Punsecito a agenciasinc.es
Publicado hace 10 años por Punsecito a agenciasinc.es

Investigadores de la UNED han desarrollado un método estadístico para detectar el contenido basura en Twitter, en concreto, en los conocidos como trending topics o temas más populares. La eficacia de la herramienta se ha probado con éxito en un análisis de 20 millones de mensajes.

Comentarios

StuartMcNight

#9 ¿Pero eso todavía existe?

D

Filtra los TT de Justin Bieber y One Direction? Si no es así, vaya un filtro de basura.

s

#18 a Twitter no lo va a destruir el spam... lo va a destruir los trending topic de justin bieber y gran hermano.

Q_uiop

#19 y #18 Si no lo solucionan en dos años Twitter sera la versión digital de la Superpop.

nava

¿Contenido basura en Twitter? ¿Se refieren a@Tonicanto1?

D

twitter es la mayor mierda que han inventado despues de facebook


reddit y 4chan ftw!!!

Cide

#7 ¿Y a qué altura dejas tuenti?

D

#9 tuenti ... un golazo por toda la escuadra al paleto del alierta

D

#12

D

#14 No había caído lol

sotanez

#25
Our system reaches values of 89.3% and 93.7% in non-spam and spam correctly classified, and only 6.3% of the non-spam tweets were misclassified as spam. We have also performed a second evaluation test with a new set of unlabeled tweets and a group of assessors in order to a further evaluation of the system. Assessors concluded that the spam detection system was able to detect a 94.5% of spam tweets and obtain a false positive rate of 5.4%.


Con esas tasas de falsos positivos me da que aún no vale para un caso real... no se yó si quiero perder tantos tweets válidos.
No recuerdo la última vez que Gmail me clasificó un correo legítimo como spam, aunque si es verdad que últimamente se le cuelan algunos falsos negativos. Claro que ellos se aprovechan de la colaboración de muchos usuarios.

D

#27 Sí, eso me pareció a mí tambien.

m

A ver, En el artículo aplican C4.5, Decorate, Random Forests.. técnicas de aprendizaje automático (inteliencia artificial) junto con métodos de lenguaje natural .La revista de es inteligencia artificial, y la investigadora pertence a un departamento de informática. No entiendo cómo el artículo habla de estadística...Puestos a eso podrían poner "las matemáticas".

D

#21 Y los algoritmos de aprendizaje, inteligencia artificial y análisis de lenguaje natural no tienen nada que ver con la estadística, claro. roll

Todo lo que mencionas son áreas informáticas que tienen su base justamente en el análisis estadístico de datos y/o pruebas aleatorias.

m

#23 sí tienen que ver, como tienen que ver con probabilidades, cálculo....en realidad el artículo presenta un trabajo de investigación que usa técnicas de muchas fuentes, pero creo que poner en el título estádistica no es del todo acertado. Yo hubiese colocado, el aprendizaje automático o minería de datos. Pero bueno, es cierto que hay cierta controversia en este tema. Desde mi punto de vista, identifico la estadística como fuente de técnicas de análisis de datos, y la minería de datos como algo más globlal: descubrimiento de patrones en grandes volúmenes de conjuntos de datos (usando para ello técnicas éstadisticas y de otros campos).

D

#26 De hecho los algoritmos de aprendizaje y la minería de datos son estadística. Que para aplicarlos se empleen impepinablemente sistemas informáticos (como para tantas otras cosas) no los convierte en subconjuntos del ámbito informático, sino en aplicaciones de la informática.

Para que me entiendas, en ningún momento el artículo especifica si los analistas que han ideado el método estadístico en cuestión han desarrollado ellos mismos el "software" que han utilizado para ello (personalmente estoy casi seguro de que así es, pero no tendría por qué). En este caso la novedad creada es el método de análisis, los ordenadores son simples herramientas.

P.D.: La estadística engloba a la minería de datos (que no es sino una de tantas aplicaciones de la estadística). Incluso según tu propia definición, que me parece acertada. Quizá te has confundido y lo has expresado al revés.

x

#21 donde has conseguido el articulo? Me gustaria echarle un vistazo, ultimamente estoy trabajando en temas de analisis de datos usando la api de twitter y me vendria muy bien ver que han hecho.

D

Ciberdelincuentes, venid a mi. Tengo twitter, pero no lo uso y tampoco tengo nada que podáis saquear. De eso ya se ha encargado el Gobierno...

Punsecito

Veis, por eso yo no tengo cuenta de Twitter: “Los ciberdelincuentes han encontrado un blanco fácil en aquellos usuarios que utilizan redes sociales como Twitter”, explica Juan Martínez-Romo, investigador del departamento de Lenguajes y Sistemas Informáticos de la UNED....

Toranks

#1 Reconoces ser un blanco fácil ¿Eh? De esos que ponen contraseñas tipo 12345 o tienen el wifi sin clave ¿Verdad? O quizás tienes muchos enemigos jurados que están día y noche intentando entrar en tus cuentas

delawen

#2 Es más peligroso la gente que lo usa con Foursquare y como diario de viajes. Es una invitación a que los ladrones entren en casa (y que los acosadores tengan material).

Punsecito

#2 Joder, ya me toca cambiar la contraseña otra vez

Punsecito

#2 ¿Cómo que el wifi tiene contraseña? Pero, ¿eso dónde te lo explican?

D

#2 ¿12345? ¡Es la es la contraseña que un idiota pondría en sus maletas!

D

#11 Para las maleta de viaje hasta te lo puedes ahorrar «

»

ampos

El artículo es maaaalo y mal ideado. Hasta casi más de la mitad del mismo, ni sabía de que iba el tema...

D

Twitter es basura...
He seguido a pepito y he conseguido 300 followers, apúntate!!!