Con la digitalización de la escritura y el auge de las búsquedas e interacciones en Internet, las palabras se han convertido en insumos muy valiosos para los modelos estadísticos y algoritmos que permiten inferir y llegar a conclusiones muy precisas sobre el comportamiento de los consumidores, entre otros usos más.
En la actualidad el lenguaje ha pasado a ser objeto de los análisis de macrodatos. Debido a que los enlaces que utiliza Google se componen de palabras y las búsquedas que se realizan en esa página también, cada vez gana más importancia el estudio de los textos como datos.
Según el libro «Todo el mundo miente: Lo que Internet y el Big Data pueden decirnos sobre nosotros mismos«, este tipo de análisis puede responder preguntas como: ¿Qué podemos ver en la frecuencia con que las palabras o frases aparecen en libros en distintos años?
El autor del libro, Seth Stephens-Davidowitz, economista y científico de datos, explica que por ejemplo, con el análisis de las palabras o frases aparecen en libros en distintos años, nos enteramos del lento incremento de la popularidad de «salchicha» y el aumento bastante reciente y rápido de la popularidad de «pizza».
Existen otros campos de acción para realizar análisis numéricos a partir de las palabras. Reseña el documento que “… existe una herramienta nueva y poderosa para analizar los textos llamada ‘análisis de sentimientos’. Ahora los científicos pueden estimar lo alegre o desolado que es un texto en particular”.
Cuando en el entorno digital las personas utilizan palabras como “fenomenal”, “impresionante”, “extraordinario”, “estupendo” o “maravilloso”, se puede asociar a que las personas se encuentran en un momento de felicidad. Si este tipo de textos se emplean para referirse a un producto, servicio o marca, se infiere que los consumidores se encuentran satisfechos.
Cuando se logran convertir las palabras en datos, se puede descubrir que tipo de helados le gusta a las personas y los supermercados podrían llenar sus estantes con ellos, también los periódicos podrían establecer qué puntos de vista quiere la gente y llenar sus páginas con ellos, concluye el autor.