La coherencia en los textos es una característica fundamental a la hora de comunicar, ya que una falta de coherencia puede hacer difícil la comprensión del mensaje. Cuando se trata de textos largos o complejos, es posible que la coherencia se pierda en algún punto, generando confusiones y errores interpretativos. Por suerte, gracias a la herramienta que presentamos hoy, podemos detectar y medir la coherencia en los textos mediante el uso de Python y la librería Textacy.
Primeros pasos: instalación de Textacy
Antes de comenzar, es necesario tener instalado Python en nuestro equipo. Si no lo tienes instalado, puedes descargarlo desde la página oficial: https://www.python.org/downloads/
Una vez instalado Python, debemos instalar la librería Textacy. Para ello, abrimos una terminal y escribimos el siguiente comando:
pip install textacy
Uso de Textacy para detectar y medir la coherencia en textos
Para comenzar, es necesario importar la librería Textacy. Para esto, escribimos el siguiente código:
import textacy
Detección de la coherencia en un solo texto
Para detectar la coherencia de un solo texto, primero debemos cargar el texto. Para este ejemplo, utilizaremos el siguiente texto:
texto_ejemplo = "El próximo lunes es feriado y no habrá clases en la escuela. Sin embargo, será un día laboral para la mayoría de las empresas, por lo que muchas personas deberán trabajar."
Una vez que cargamos el texto, podemos calcular la coherencia mediante la función textacy.text_stats.flesch_kincaid_grade_level
, la cual nos devuelve el nivel de grado del texto. Es importante mencionar que esta función mide la facilidad de lectura del texto, y entre mayor sea el nivel de grado, más difícil será su comprensión.
nivel_de_grado = textacy.text_stats.flesch_kincaid_grade_level(texto_ejemplo)
En este ejemplo, el valor de nivel_de_grado
es 7.6, lo que significa que el texto tiene un nivel de grado de 7 (equivalente a un nivel de educación primaria) y que el decimales corresponde a una fracción de año escolar adicional.
Detección de la coherencia en varios textos
En algunos casos, es necesario medir la coherencia de varios textos. Para realizar esta tarea, utilizamos la función textacy.text_stats.aggregate_text_stats
, la cual nos permite calcular los estadísticos de varios textos a la vez. Para realizar este ejemplo, utilizaremos tres textos diferentes:
texto1 = "La lluvia ha sido constante durante toda la semana, lo que ha causado inundaciones en algunos sectores de la ciudad."
texto2 = "El partido de fútbol será el próximo domingo a las 3 de la tarde en el estadio central."
texto3 = "El próximo martes se llevará a cabo una reunión importante en la oficina. Es importante que todos los asistentes lleguen a tiempo."
Una vez que tenemos los textos cargados, procedemos a calcular los estadísticos mediante la función textacy.text_stats.aggregate_text_stats
:
estadisticos = textacy.text_stats.aggregate_text_stats([texto1, texto2, texto3])
print(estadisticos)
La respuesta será un diccionario con los estadísticos de los textos:
{'n_sents': 6,
'n_words': 75,
'n_syllables': 100,
'n_unique_words': 60,
'n_long_words': 25,
'n_monosyllable_words': 38,
'n_polysyllable_words': 5,
'flesch_kincaid_grade_level': 6.3,
'flesch_reading_ease': 71.22,
'smog_index': 8.04,
'gunning_fog_index': 9.68,
'coleman_liau_index': 5.42,
'automated_readability_index': 5.5,
'lix': 29.33,
'gulpease_index': 54.33}
Medir la coherencia en los textos es una tarea fundamental a la hora de comunicar de manera efectiva. Gracias a Python y la librería Textacy, podemos detectar y medir la coherencia en los textos de manera sencilla y eficiente. Te invitamos a experimentar con estas herramientas y descubrir todas las posibilidades que nos ofrecen.
Links de interés
Para mayor información sobre Python y Textacy, te recomendamos visitar los siguientes enlaces: