T-LAB 10.2 - AIUDA EN RED - T-LAB Instrumentos para el análisis de textos

T-LAB 10.2 - AIUDA EN RED

T-LAB

Introducción

Qué hace y qué permite hacer

Requisitos y prestaciones

Preparación del corpus

Preparación del corpus

Criterios Estructurales

Criterios Formales

Archivo

Importar un único archivo...

Preparar un Corpus (Corpus Builder)

Abrir un projecto ya existente

Configuraciones de Análisis

Configuración Automática y Personalizada

Personalización del Diccionario

Análisis de Co-ocurrencias

Asociaciones de Palabras

Análisis de Co-Palabras y Mapas Conceptuales

Comparaciones entre Parejas de Palabras-Clave

Análisis de Secuencias y Análisis de Redes

Co-occurrence Toolkit

Análisis Temáticos

Análisis Temático de Contextos Elementales

Modelización de Temas Emergentes

Clasificación Temática de Documentos

Clasificación Basada en Diccionarios

Textos y Discursos como Sistemas Dinámicos

Análisis Comparativos

Análisis de Especificidades

Análisis de Correspondencias

Análisis de Correspondencias Múltiples

Cluster Analysis

Descomposición de Valores Singulares

Herramientas Léxico

Text Screening / Desambiguaciónes

Palabras Vacías

Segmentación de Palabras

Otras Herramientas

Variable Manager

Búsqueda avanzada en el Corpus

Clasificación de Nuevos Documentos

Contextos Clave de Palabras Temáticas

Exportar Tablas Personalizadas

Importar-Exportar una lista de Identificadores

Glosario

Análisis de Correspondencias

Cadenas de Markov

Cluster Analysis

Contextos Elementales

Corpus y Subconjuntos

Desambiguación

Documentos Primarios

Índices de Asociación

Lexia y Lexicalización

Multiwords (Multi-Palabras)

Normalización del Corpus

Núcleos Temáticos

Ocurrencias y Co-ocurrencias

Palabras y Lemas

Polos de Factores

Tablas de Datos

Umbral de Frecuencia

Unitad de Análisis

Unidad de Contexto

Variables y Modalidades

www.tlab.it

Lematización

En los diccionarios lingüísticos que consultamos, cada entrada corresponde a un lema que - generalmente - define un conjunto de palabras con la misma raíz lexical (el lexema) y que pertenece a la misma categoría gramatical (verbo, adjetivo, etc.).

En general, la lematización exige que las formas del verbo se pongan en infinitivo, los sustantivos en singular, etcétera.

Por ejemplo, las formas flexivas "hablan" y " hablando ", que resultan de la combinación de una raíz única con dos diversos sufijos (< - an > y < - ando >), se remiten al mismo lema "habl-ar". Sin embargo, hay algunos casos en los que la lematización no observa la regla de la raíz común; especialmente en los verbos irregulares.

Durante la fase de importación del corpus, T-LAB consiente hacer un tipo específico de lematización automática que sigue la lógica del árbol siguiente .

Obviamente, el diccionario de referencia es el que ha sido realizado en T-LAB.

Las abreviaturas de las cuatro-categorías se utilizan en muchas tablas, siempre en la columna "INF".

NOTA:
- la categoría "DIS " ("distinguir") significa que T-LAB no aplica la lematización estándar, para no anular las diferencias de significado entre las diversas palabras;
- a veces, para diferenciar homógrafos, T-LAB añade el carácter '_' (underscore) a su lema.