Files
Download Full Text (2.7 MB)
Description
En los últimos años, la aparición de noticias falsas ha supuesto un desafío significativo para la sociedad. Este tipo de noticias ha tenido un alto impacto en la opinión pública y en la toma de decisiones. El objetivo de este trabajo es desarrollar un sistema capaz de analizar la veracidad de las noticias permitiendo también establecer una comparativa entre distintos enfoques de PLN aplicado a la clasificación multiclase. Para abordar este problema se emplea el conjunto de datos LIAR2, al cual se le aplica un preprocesamiento completo adaptado a diversas técnicas de procesamiento del lenguaje natural (PLN). Asimismo, se estudian y aplican diversas técnicas evaluando su efectividad en la clasificación de noticias, permitiendo realizar una comparación de las métricas de cada una de estas técnicas con el fin de optimizar el modelo y generar mejores resultados. Finalmente, el modelo de clasificación más eficiente se integra en una interfaz gráfica creando un prototipo de una web, permitiendo a los usuarios consultar fácilmente la veracidad de las noticias. Además, se proporcionará explicabilidad a la web justificando las decisiones del modelo. Esto proporcionará una mayor transparencia y confianza. De esta manera, este proyecto busca contribuir activamente en la lucha contra la desinformación mediante una herramienta tecnológica automatizada y comparativa, útil para la clasificación efectiva de noticias falsas.
INGLÉS
In recent years, the emergence of fake news has posed a significant challenge to society. This type of news has had a high impact on public opinion and decision making. The purpose of this work is to develop a system capable of analyzing the veracity of the news allowing also to establish a comparison between different NLP approaches applied to multiclass classification. To address this problem, the LIAR2 dataset is used, to which a complete preprocessing adapted to different natural language processing (NLP) techniques is applied. Likewise, several techniques are studied and applied to evaluate their effectiveness in news classification, allowing a comparison of the metrics of each of these techniques in order to optimize the model and generate better results. Finally, the most efficient classification model is integrated into a graphical interface creating a prototype of a website, allowing users to easily consult the veracity of the news. In addition, the web will be provided with explainability by justifying the model's decisions. This will provide greater transparency and trust. In this way, this project seeks to actively contribute to the fight against disinformation by means of an automated and comparative technological tool, useful for the effective classification of fake news.
Publication Date
2025
City
Madrid
Keywords
Noticias falsas; Desinformación; Procesamiento del Lenguaje Natural (PLN); Clasificación multiclase; LIAR2; Veracidad; Modelo de Clasificación; Web; Comparativa; Explicabilidad.
Recommended Citation
Galiano García, Jorge, "Detección automática de noticias falsas mediante técnicas de Procesamiento del Lenguaje Natural." (2025). Máster en Inteligencia Artificial. 19.
https://sciencevalue.udit.es/tfm_videojuegos_tecnologia/19
