T-LAB Home
T-LAB PLUS 2019 - AIUDA EN RED Prev Page Prev Page
T-LAB
Introducción
Qué hace y qué permite hacer
Requisitos y prestaciones
Preparación del corpus
Preparación del corpus
Criterios Estructurales
Criterios Formales
Archivo
Importar un único archivo...
Preparar un Corpus (Corpus Builder)
Abrir un projecto ya existente
Configuraciones de Análisis
Configuración Automática y Personalizada
Personalización del Diccionario
Análisis de Co-ocurrencias
Asociaciones de Palabras
Análisis de Co-Palabras y Mapas Conceptuales
Comparaciones entre Parejas de Palabras-Clave
Análisis de Secuencias y Análisis de Redes
Concordancias
Análisis Temáticos
Análisis Temático de Contextos Elementales
Modelización de Temas Emergentes
Clasificación Temática de Documentos
Clasificación Basada en Diccionarios
Contextos Clave de Palabras Temáticas
Análisis Comparativos
Análisis de Especificidades
Análisis de Correspondencias
Análisis de Correspondencias Múltiples
Cluster Analysis
Descomposición de Valores Singulares
Herramientas Léxico
Text Screening / Desambiguaciónes
Vocabulario
Palabras Vacías
Multi-Palabras
Segmentación de Palabras
Otras Herramientas
Variable Manager
Búsqueda avanzada en el Corpus
Tablas de Contingencias
Editor
Glosario
Análisis de Correspondencias
Cadenas de Markov
Chi-cuadrado
Cluster Analysis
Codificación
Contextos Elementales
Corpus y Subconjuntos
Desambiguación
Documentos Primarios
Especificidad
Graph Maker
Homógrafos
IDnumber
Índices de Asociación
Isotopía
Lematización
Lexia y Lexicalización
MDS
Multiwords (Multi-Palabras)
N-gramas
Naïve Bayes
Normalización del Corpus
Núcleos Temáticos
Ocurrencias y Co-ocurrencias
Palabras y Lemas
Palabras Clave
Perfil
Polos de Factores
Stop Word List
Tablas de Datos
Umbral de Frecuencia
TF-IDF
Unitad de Análisis
Unidad de Contexto
Unidad Lexical
Valor Test
Variables y Modalidades
Bibliografía
www.tlab.it

n-grama


En T-LAB, un n-grama es una secuencia de dos (bi-grama) o más palabras claves presentes dentro del mismo contexto elemental.

Su uso está vinculado exclusivamente al cálculo de las co-ocurrencias.
Cabe destacar que, dentro del mismo contexto elemental, la contigüidad de las palabras consideradas no tiene en cuenta ni las 'palabras vacías' (es decir, stop-word) ni la puntuación.

Consideremos, a modo de ejemplo, el siguiente contexto elemental:

La Nación española es libre e independiente, y no es ni puede ser patrimonio de ninguna familia ni persona

En el supuesto de que los cinco ítems en rojo estén incluidos en nuestro listado de palabras claves, las segmentación en bi-gramas produciría los siguientes contextos de co-ocurrencia:

Nación & español
español & libre
libre & independiente
independiente & patrimonio
etc. etc.

Por otro lado, en el caso de tri-gramas, el resultado sería el siguiente:

Nación & español & libre
español & libre & independiente
libre & independiente & patrimonio
independiente & patrimonio & familia
etc. etc.


Es importante remarcar que, en el caso de los contextos elementales, las co-ocurrencias están basadas en la presencia de las palabras en el mismo 'lugar' (eje. frase, párrafo, etc.). Por otro lado, en el caso de n-gramas, las co-ocurrencias se fundamentan en una relación de contigüidad.
En T-LAB es posible implementar el análisis de co-ocurrencias basadas en n-gramas a través de la herramienta Asociaciones de Palabras. Además, se puede implementar el análisis markoviano de bi-gramas utilizando la herramienta Análisis de las Secuencias.