T-LAB 10.2 - AIUDA EN RED - T-LAB Instrumentos para el análisis de textos

T-LAB 10.2 - AIUDA EN RED

T-LAB

Introducción

Qué hace y qué permite hacer

Requisitos y prestaciones

Preparación del corpus

Preparación del corpus

Criterios Estructurales

Criterios Formales

Archivo

Importar un único archivo...

Preparar un Corpus (Corpus Builder)

Abrir un projecto ya existente

Configuraciones de Análisis

Configuración Automática y Personalizada

Personalización del Diccionario

Análisis de Co-ocurrencias

Asociaciones de Palabras

Análisis de Co-Palabras y Mapas Conceptuales

Comparaciones entre Parejas de Palabras-Clave

Análisis de Secuencias y Análisis de Redes

Co-occurrence Toolkit

Análisis Temáticos

Análisis Temático de Contextos Elementales

Modelización de Temas Emergentes

Clasificación Temática de Documentos

Clasificación Basada en Diccionarios

Textos y Discursos como Sistemas Dinámicos

Análisis Comparativos

Análisis de Especificidades

Análisis de Correspondencias

Análisis de Correspondencias Múltiples

Cluster Analysis

Descomposición de Valores Singulares

Herramientas Léxico

Text Screening / Desambiguaciónes

Palabras Vacías

Segmentación de Palabras

Otras Herramientas

Variable Manager

Búsqueda avanzada en el Corpus

Clasificación de Nuevos Documentos

Contextos Clave de Palabras Temáticas

Exportar Tablas Personalizadas

Importar-Exportar una lista de Identificadores

Glosario

Análisis de Correspondencias

Cadenas de Markov

Cluster Analysis

Contextos Elementales

Corpus y Subconjuntos

Desambiguación

Documentos Primarios

Índices de Asociación

Lexia y Lexicalización

Multiwords (Multi-Palabras)

Normalización del Corpus

Núcleos Temáticos

Ocurrencias y Co-ocurrencias

Palabras y Lemas

Polos de Factores

Tablas de Datos

Umbral de Frecuencia

Unitad de Análisis

Unidad de Contexto

Variables y Modalidades

www.tlab.it

TF-IDF

Esta medida, propuesta por G. Salton (1989), permite comprobar el peso de un termino (unidad lexical) en un documento (unidad de contexto).

Su fórmula es la siguiente:

w i,j = tf i,j x idf i (Term Frequency x Inverse Document Frequency)

En la que:

tf i,j = número de ocurrencias del termino i en el documento j
df i = número de documentos que contienen i
N = número de documentos en una colección (corpus)

El valor tf i,j (Frecuencia del Termino) puede ser normalizada en la manera siguiente:

tf i,j = tf i,j / Max (f i,j )

en la que Max (f i,j ) es la frecuencia máxima de un cualquier termino i en el documento j .