T-LAB Home
T-LAB 9.1 AIUDA EN RED Prev Page Prev Page
T-LAB
Introducción
Qué hace y qué permite hacer
Requisitos y prestaciones
Preparación del corpus
Preparación del corpus
Criterios Estructurales
Criterios Formales
Archivo
Preparar un Corpus (Corpus Builder)
Importar un Corpus
Abrir un projecto ya existente
Configuraciones de Análisis
Configuración Automatica
Configuración Personalizada
Análisis de Co-ocurrencias
Asociaciones de Palabras
Análisis de Co-Palabras y Mapas Conceptuales
Comparaciones entre Parejas de Palabras-Clave
Análisis de Secuencias
Concordancias
Análisis Temáticos
Análisis Temático de Contextos Elementales
Clasificación Temática de Documentos
Clasificación Basada en Diccionarios
Modelización de Temas Emergentes
Contextos Clave de Palabras Temáticas
Análisis Comparativos
Análisis de Especificidades
Análisis de Correspondencias
Análisis de Correspondencias Múltiples
Cluster Analysis
Tablas de Contingencias
Herramientas Léxico
Vocabulario
Personalización del Diccionario
Desambiguación
Palabras Vacías
Multi-Palabras
Otras Herramientas
Variable Manager
Crear un Sub-Corpus
Editor
Memo
Glosario
Análisis de Correspondencias
Cadenas de Markov
Chi-cuadrado
Cluster Analysis
Codificación
Contextos Elementales
Corpus y Subconjuntos
Desambiguación
Documentos Primarios
Especificidad
Homógrafos
IDnumber
Índices de Asociación
Isotopía
Lematización
Lexia y Lexicalización
MDS
Multiwords (Multi-Palabras)
N-gramas
Naïve Bayes
Normalización del Corpus
Núcleos Temáticos
Ocurrencias y Co-ocurrencias
Palabras y Lemas
Palabras Clave
Perfil
Polos de Factores
Stop Word List
Tablas de Datos
Umbral de Frecuencia
TF-IDF
Unitad de Análisis
Unidad de Contexto
Unidad Lexical
Valor Test
Variables y Modalidades
Bibliografía

Unidad de Análisis


Las unidades de análisis de T-LAB son de dos tipos: unidades lexicales y unidades de contexto.

A - las UNIDADES LEXICALES son palabras, simples o "múltiple", archivadas y clasificadas en base a algún criterio. En particular, en la base de datos T-LAB, cada unidad lexical constituye un registro clasificado con dos campos: palabra y lema. En el primer campo (palabra) se enumeran las palabras así como aparecen en el corpus, mientras que en el segundo (lema), se enumeran las etiquetas atribuidas a grupos de unidades lexicales clasificadas según criterios lingüísticos (ej. lematización) o a través de diccionarios y plantillas semánticas definidas por el usuario.

B - Las UNIDADES DE CONTEXTO son porciones de texto en las que se puede dividir el corpus. En particular, en la lógica T-LAB, las unidades de contexto pueden ser de tres tipos:

B.1 documentos primarios correspondientes a la subdivisión "natural" del corpus
(ej. entrevistas, artículos, respuestas a preguntas abiertas, etc.), o sea a los contextos iniciales definidos por el usuario;


B.2 contextos elementales, correspondientes a unidades sintagmáticas de una o más frases y definidas de modo automático (o semi-automático) por T-LAB. Por tanto, en la base de datos T-LAB cada documento primario está constituido por uno o más contextos elementales;


B.3 subconjuntos del corpus que corresponden a grupos de documentos primarios atribuibles a la misma "categoría" (es. entrevistas de "hombres" o de "mujeres", artículos de un determinado año o de un determinado periódico, y así sucesivamente).