A. Vergara López, M. Ayestaran ArregI
Eustat es muy consciente de que, en la estadística oficial, el “Big Data” es una ventana de nuevas fuentes de información con múltiples aplicaciones. La calidad en las estadísticas oficiales y simplificar las encuestas demandadas son dos focos importantes de mejora que pueden conseguirse mediante proyectos de “scrapeo” e inteligencia artificial.
Durante estos últimos años Eustat ha estado trabajando en diferentes proyectos de “Big Data”, entre los que destacan:
• “Scrapeo” de precios de hoteles en Booking.
• Encontrar URLs de las empresas de la Comunidad Autónoma del País Vasco.
• Detección de redes sociales en las páginas web.
• Detección de la utilización de “e-commerce” por las empresas.
• Prototipos para conocer las tecnologías utilizadas en las páginas web.
• Detección del código de actividad “CNAE” a través de “Text Minning”.
En esta ponencia explicaremos los procesos utilizados en algunos de nuestros proyectos.
Palabras clave: BigData, Scrapeo, BeatifullSoup, Selenium, Phyton, R, Java
Programado
Estadística Pública
9 de noviembre de 2023 11:40
CC1: Auditorio