T-LAB Home
T-LAB 10.2 - AIUDA EN RED Prev Page Prev Page
T-LAB
Introducción
Qué hace y qué permite hacer
Requisitos y prestaciones
Preparación del corpus
Preparación del corpus
Criterios Estructurales
Criterios Formales
Archivo
Importar un único archivo...
Preparar un Corpus (Corpus Builder)
Abrir un projecto ya existente
Configuraciones de Análisis
Configuración Automática y Personalizada
Personalización del Diccionario
Análisis de Co-ocurrencias
Asociaciones de Palabras
Análisis de Co-Palabras y Mapas Conceptuales
Comparaciones entre Parejas de Palabras-Clave
Análisis de Secuencias y Análisis de Redes
Concordancias
Co-occurrence Toolkit
Análisis Temáticos
Análisis Temático de Contextos Elementales
Modelización de Temas Emergentes
Clasificación Temática de Documentos
Clasificación Basada en Diccionarios
Textos y Discursos como Sistemas Dinámicos
Análisis Comparativos
Análisis de Especificidades
Análisis de Correspondencias
Análisis de Correspondencias Múltiples
Cluster Analysis
Descomposición de Valores Singulares
Herramientas Léxico
Text Screening / Desambiguaciónes
Vocabulario
Palabras Vacías
Multi-Palabras
Segmentación de Palabras
Otras Herramientas
Variable Manager
Búsqueda avanzada en el Corpus
Clasificación de Nuevos Documentos
Contextos Clave de Palabras Temáticas
Exportar Tablas Personalizadas
Editor
Importar-Exportar una lista de Identificadores
Glosario
Análisis de Correspondencias
Cadenas de Markov
Chi-cuadrado
Cluster Analysis
Codificación
Contextos Elementales
Corpus y Subconjuntos
Desambiguación
Documentos Primarios
Especificidad
Graph Maker
Homógrafos
IDnumber
Índices de Asociación
Isotopía
Lematización
Lexia y Lexicalización
MDS
Multiwords (Multi-Palabras)
N-gramas
Naïve Bayes
Normalización del Corpus
Núcleos Temáticos
Ocurrencias y Co-ocurrencias
Palabras y Lemas
Palabras Clave
Perfil
Polos de Factores
Stop Word List
Tablas de Datos
Umbral de Frecuencia
TF-IDF
Unitad de Análisis
Unidad de Contexto
Unidad Lexical
Valor Test
Variables y Modalidades
Bibliografía
www.tlab.it

Palabras Asociadas y Mapas Conceptuales


NOTA: Las imagenes contenidas en este apartado hacen referencia a una versión anterior de T-LAB, ya que el interfaz de T-LAB 10 cambia ligeramente. Además: a) si se escoge la opción 'selección automática de las palabras clave', los diferentes clústeres de elementos vienen representados en los mapas MDS con colores diferentes; b) se ha agregado la técnica de visualización llamada t-SNE (t-Distributed Stochastic Neighbor Embedding); c) una nueva herramienta (Graph Maker) permite crear y exportar diferentes tipos de gráficos dinámicos en formato HTML; d) el uso del botón derecho del ratón sobre las tablas que incluyen las palabras clave permite acceder a las las opciones avanzadas; e) una galería de imágenes de acceso rápido que funciona como un menú adicional permite cambiar entre varias salidas con un solo clic.
Algunas de estas nuevas características se destacan en la imagen de abajo.

Esta herramienta T-LAB permite analizar dos tipos de relaciones concernientes las co-ocurrencias de palabras:

A - entre las palabras-clave seleccionadas (lemas o categorías), si sus cantidad no excede los 500 elementos (mínimo 10);
B - entre (y dentro) clusters (es decir Núcleos Temáticos), si la cantidad de palabras-clave seleccionadas excede los 100 elementos (máximo 3.000).

El usuario puede seleccionar el índice de asociación a ser utilizado y, sólo en el caso de la opción B, puede seleccionar tanto la cantidad máxima de clusters a obtener (de 50 a 100) como la cantidad máxima de palabras clave por cluster.

El proceso de cálculo empleado prevé los pasos siguientes:

1- construcción de una matriz de co-ocurrencias (palabra x palabra);
2- cálculo de los índices de asociación seleccionados (Coseno, Dice, Jaccard, Equivalencia, Inclusión, Información Mutua);
3- clustering jerárquico de la matriz de la desemejanza;
4- construcción de una segunda matriz de co-ocurrencias (cluster x cluster);

5- representación gráfica de las relaciones a través del multidimensional scaling y del análisis de correspondencias.

N.B:
- en el caso 'A' (véase arriba), el usuario puede revisar y personalizar la selección de las palabras-clave (véase imagen siguiente) y
T-LAB no implementaría las fases 3 y 4;


- la calidad de resultados depende de una cuidadosa selección de palabras clave;
- puesto que las multi-palabras (multiwords) no catalogadas por T-LAB son casos específicos de co-ocurrencia y que la opción "B" trata esos como unos pequeños racimos (ej. "Twin" + "Towers"), se aconseja de resolver estos casos durante la fase de importación. En todo caso, sin la repetición de la importación del corpus, es posible realizar cambios por medio de la función Personalización del Diccionario (ej. asignando la etiqueta "Twin_Towers" a los dos diversos items "Twin" + "Towers");
- haciendo clic sobre los botones apropiados todas las tablas de datos pueden ser comprobadas (véase abajo).

Al término del análisis automático, están disponibles cuatro tipos de gráficos que pueden ser personalizados utilizando el botón derecho del ratón.

1 - Mapa MDS

2 - Análisis Factorial de Correspondencias

3 - Diagrama de Asociaciones

4 - Mapa con las medidas de Centralidad y Densidad (solo después de un cluster análisis)

En detalle, los resultados obtenidos por el Análisis de Correspondencias se pueden visualizar usando las coordenadas de los primeros diez ejes (véase "A" abajo). Puesto que T-LAB nos permite verificar los Valores Test de cada factor (véase "B" abajo), esto tipo de output se puede utilizar para una cuidadosa interpretación de las relaciones entre clusters y/o entre palabras clave.

Los gráficos pueden ser explorados y modificados de las maneras siguientes:

ACCIÓN
RESULTADO
clic en un ítem de la tabla o en un punto del gráfico
diagrama de las asociaciones correspondientes
clic en una etiqueta de la columna "CLUSTER" (véase "A" abajo)
lista con los elementos del cluster
clic en el botón "Substituye" (véase "B" abajo)
nueva etiqueta atribuida al cluster
clic en el botón "Etapas de agregación" (véase "C" abajo)
agregaciones en el cluster
clic en botón derecho del ratón
caja de diálogo para personalizar los gráficos

 

Otra ventana T-LAB (véase ventana siguiente, paso 1) permite crear archivos gráficos que pueden ser editados mediante los softwares para el network analysis, como Gephi, Pajek, Ucinet, yEd entre otros. En este caso, las opciones disponibles son las siguientes: seleccionar los ítems (es decir, los nudos) a insertar en los gráficos (véase abajo, pasos 2 y 3), exportar la matriz de adyacencia correspondiente (véase abajo, paso 4), exportar el tipo de archivo seleccionado (véase abajo, paso 5).

NOTA: En T-LAB 10 la ventana que se muestra a continuación ha sido sustituida por la herramienta Graph Maker.

Por ejemplo, un archivo en formato .GML exportado por T-LAB permite realizar un grafico como el siguiente.

 

Hay tres tipologías de tablas exportables a través de esta herramienta de T-LAB:

1 - la tabla "Miembros" se refiere a la agregación jerárquica de palabras dentro de cada cluster;

2 - la tabla "Resumen" (véase abajo) incluye las medidas siguientes:

- ECQ = cantidad de contextos elementales en los cuales dos o más palabras del cluster son co-ocurrentes;
- Centrality (Centralidad) = media de índices de asociación referentes a las relaciones entre clusters;
- Density (Densidad) = media de índices de asociación de palabras dentro de cada cluster.

3 - la tabla "Índices de asociación" (véase abajo) incluye medidas de las relaciones de semejanza entre (between) y dentro (within) los clusters.

Between
Within

 

N.B.:
- cuando un cluster análisis no se ha hecho, la tabla "Miembros" no está disponible, la tabla "Resumen" se simplifica y la tabla "Índices de asociación" se refiere solamente a las co-ocurrencias de palabras;
- al final del análisis, el diccionario de Núcleos Temáticos (es decir la lista de las etiquetas asignadas a cada cluster de las palabras) se puede exportar y, después de una cuidadosa revisión, puede ser importado por medio de la función Personalización del Diccionario. De esta manera el usuario podrá realizar algunos análisis de segundo orden (es decir análisis concernientes "temas" o "conceptos").