T-LAB Home
T-LAB 10.2 - AIUDA EN RED Prev Page Prev Page
T-LAB
Introducción
Qué hace y qué permite hacer
Requisitos y prestaciones
Preparación del corpus
Preparación del corpus
Criterios Estructurales
Criterios Formales
Archivo
Importar un único archivo...
Preparar un Corpus (Corpus Builder)
Abrir un projecto ya existente
Configuraciones de Análisis
Configuración Automática y Personalizada
Personalización del Diccionario
Análisis de Co-ocurrencias
Asociaciones de Palabras
Análisis de Co-Palabras y Mapas Conceptuales
Comparaciones entre Parejas de Palabras-Clave
Análisis de Secuencias y Análisis de Redes
Concordancias
Co-occurrence Toolkit
Análisis Temáticos
Análisis Temático de Contextos Elementales
Modelización de Temas Emergentes
Clasificación Temática de Documentos
Clasificación Basada en Diccionarios
Textos y Discursos como Sistemas Dinámicos
Análisis Comparativos
Análisis de Especificidades
Análisis de Correspondencias
Análisis de Correspondencias Múltiples
Cluster Analysis
Descomposición de Valores Singulares
Herramientas Léxico
Text Screening / Desambiguaciónes
Vocabulario
Palabras Vacías
Multi-Palabras
Segmentación de Palabras
Otras Herramientas
Variable Manager
Búsqueda avanzada en el Corpus
Clasificación de Nuevos Documentos
Contextos Clave de Palabras Temáticas
Exportar Tablas Personalizadas
Editor
Importar-Exportar una lista de Identificadores
Glosario
Análisis de Correspondencias
Cadenas de Markov
Chi-cuadrado
Cluster Analysis
Codificación
Contextos Elementales
Corpus y Subconjuntos
Desambiguación
Documentos Primarios
Especificidad
Graph Maker
Homógrafos
IDnumber
Índices de Asociación
Isotopía
Lematización
Lexia y Lexicalización
MDS
Multiwords (Multi-Palabras)
N-gramas
Naïve Bayes
Normalización del Corpus
Núcleos Temáticos
Ocurrencias y Co-ocurrencias
Palabras y Lemas
Palabras Clave
Perfil
Polos de Factores
Stop Word List
Tablas de Datos
Umbral de Frecuencia
TF-IDF
Unitad de Análisis
Unidad de Contexto
Unidad Lexical
Valor Test
Variables y Modalidades
Bibliografía
www.tlab.it

Contextos Elementales


Durante la fase de la importación, T-LAB lleva a cabo una segmentación del corpus en contextos elementales, para facilitar las exploraciones del usuario y, sobre todo, para efectuar los análisis que requieren el cómputo de las co-ocurrencias.

Según la elección del usuario, los contextos elementales pueden ser:

1 - Frases

Contextos elementales que terminan con signos de puntuación (.?!) y que no superan longitud máxima de 1.000 caracteres.

2 - Fragmentos

Contextos elementales de longitud comparable y compuestos de uno o más enunciados.

En este caso, las reglas de segmentación usadas por T-LAB son las siguientes:

- considerar como contexto elemental cada secuencia de palabras interrumpida por el punto y a parte y cuyas dimensiones sean inferiores a la longitud de 400 caracteres;

- en el caso en el que, dentro de la longitud máxima, no haya ningún punto y a parte, buscar, en el orden, otros signos de puntuación (? ! ; : ,). Si no se encontraran, segmentar en base a un criterio estadístico, pero sin truncar las unidades lexicales.

3 - Párrafos

Contextos elementales que terminan con signos de puntuación (.?!) y retorno del carro (longitud máxima: 2.000 caracteres).

4 - Textos Breves

Esta opción se permite solamente cuando la longitud máxima de textos no supera los 2.000 caracteres (por ejemplo, las respuestas a preguntas abiertas).

NOTA:

- El fichero corpus_segments.dat contiene el resultado de la segmentación del corpus;
- En T-LAB, la opción concordancias permite verificar los contextos elementales en los que está presente cada palabra (o lema).