T-LAB 10.2 - AIUDA EN RED - T-LAB Instrumentos para el análisis de textos

NOTA: Las imagenes contenidas en este apartado hacen referencia a una versión anterior de T-LAB, ya que el interfaz de T-LAB 10 cambia ligeramente. Además: a) una nueva herramienta (Graph Maker) permite crear y exportar diferentes tipos de gráficos dinámicos en formato HTML; b) el botón dendrograma ha sido sustituido por la herramienta Graph Maker; c) una galería de imágenes de acceso rápido que funciona como un menú adicional permite cambiar entre varias salidas con un solo clic.

La opción Cluster Análisis pone en marcha un cómputo que utiliza los resultados de un precedente análisis de correspondencias; más concretamente, el cómputo utiliza las coordenadas de los objetos ( unidades lexicales o unidades de contexto) en los primeros ejes factoriales (hasta un máximo de 10).

Según los casos, el usuario puede elegir entre tres técnicas de cluster analysis:

a) jerárquica (método Ward);
b) K-means (método MacQueen);
c) hdbscan (hierarchical DBSCAN).

Las dos primeras (a, b) permiten explorar (tablas y gráficos) soluciones de 3 a 20 cluster; mientras que la tercera (c), que requiere un parámetro adicional (es decir, el número mínimo de palabras dentro de un clúster), permite al usuario explorar solo una solución.

NOTA: Cuando se utilisa el método jerárquico T-LAB hace disponible una opción (véase el botón 'Refinar') que permite al usuario combinar los métodos de Ward y K-means.

Una breve descripción de las tres técnicas está contenida en el glosario de este manual.

Al término de proceso, T-LAB muestra gráficos y tablas.

Los gráficos representan los clusters (racimos) en el mismo espacio detectado por el análisis de correspondencias (véase abajo).

NOTA: Para explorar las varias combinaciones de los ejes factoriales, es suficiente seleccionarlos en los boxes apropiados ("Eje X", "Eje Y").

En el caso de clusterización jerárquica, el usuario puede explorar fácilmente las particiones diferentes.

Dendrogramas, gráficos a tarta y histogramas permiten verificar las características de cada partición.

Algunos histogramas nos permiten verificar las relaciones entre los clusters y las variables.

Las tablas son de dos tipos:

(A) si los objetos arracimados son unidades lexicales, por cada una de ellas (y por cada cluster) se exhiben las ocurrencias respectivas ('OCC') y las distancias ('DIST') respectivas de los centroides; también, por cada variable que se asocie significativamente al cluster examinado, se exhibe el valor respectivo del Valor Test.

(B) si los objetos arracimados son contextos elementales, las características de cada cluster (las unidades lexicales y las variables) se describen por medio del mismo método usado en Análisis Temático de Contextos Elementales (véase abajo).

En el caso de análisis realizados con métodos jerárquicos o K-means T-LAB permite visualizar y exportar un archivo (ver botón "Output HTML") en el que se muestran las características de los cluster y algunas medidas relativas a la calidad de la partición en estudio.