Modelado de Tópicos: Caso Práctico – Cátedra Santalucía de Analytics for Education

Por Jenny Alexandra Cifuentes

Profesora de Métodos Cuantitativos, Universidad Pontificia Comillas.

Pincha aquí para ver el vídeo sobre este post

En la era actual de transformación digital, donde las tecnologías disruptivas avanzan rápidamente y la información fluye constantemente a través de redes sociales, comprender la percepción pública sobre innovaciones emergentes como ChatGPT representa un desafío cada vez más relevante. En este video, se guía a través de un caso de estudio titulado «Descifrando la Percepción Pública sobre ChatGPT: Un Estudio a partir del Análisis Automático de Publicaciones de una Red Social». Este análisis utiliza Latent Dirichlet Allocation (LDA) junto con otras técnicas de pre-procesamiento para explorar la percepción del público general sobre ChatGPT, una nueva herramienta de inteligencia artificial (IA) generativa.
El estudio, realizado por la estudiante Elena Suárez y dirigido por la profesora Alexandra Cifuentes, se centra en identificar y analizar los temas predominantes en las discusiones sobre ChatGPT dentro de las plataformas sociales. El objetivo no es solo catalogar opiniones, sino también entender las expectativas, preocupaciones y la terminología asociada que prevalece en el discurso público. Este enfoque nos ofrece una ventana a la mente colectiva de la sociedad, proporcionando información valiosa sobre la recepción de tecnologías disruptivas. El primer paso en este análisis fue el preprocesamiento de datos, una fase indispensable para garantizar la calidad y precisión de los resultados de LDA. El texto extraído de las redes sociales fue sometido a un proceso de limpieza, incluyendo la normalización para eliminar diferencias de formato y acentuación, y la eliminación de enlaces web, caracteres especiales, números, y stopwords. Además, se empleó la lematización para consolidar diferentes formas de una palabra en una sola entidad, lo que refina aún más el corpus para el análisis.
Utilizando LDA, se identificaron cinco áreas temáticas distintas que reflejan la percepción pública de ChatGPT. Estos tópicos incluyeron desde discusiones sobre grandes inversiones y desarrollos tecnológicos, destacando actores clave como Google y Microsoft, hasta visiones futuristas del impacto de la inteligencia artificial en la sociedad y la industria. Otros tópicos se centraron en la innovación en el procesamiento del lenguaje y las aplicaciones prácticas de modelos como ChatGPT en educación y marketing, así como debates sobre la ética y la calidad del contenido generado por IA. Para determinar el número óptimo de tópicos, el estudio utilizó la métrica de coherencia de tópicos, encontrando que cinco tópicos eran ideales para capturar la diversidad y profundidad de las discusiones en torno a ChatGPT. Esta fase del análisis fue apoyada por herramientas de visualización como PyLDAVis, que proporcionaron representaciones gráficas de la relación entre los tópicos, facilitando una interpretación más detallada de los datos.
El estudio concluye que la percepción pública de ChatGPT es multidimensional, reflejando tanto el entusiasmo por las posibilidades tecnológicas como la cautela ante sus implicaciones éticas y prácticas. Este análisis no solo enriquece nuestra comprensión sobre la recepción pública hacia innovaciones en IA, sino que también proporciona direcciones claras para futuras investigaciones, recomendando que los estudios posteriores incorporen análisis de sentimientos y continúen ajustando los métodos de procesamiento de datos para adaptarse a la evolución del discurso público.

Deja una respuesta Cancelar la respuesta