T-LAB Home
T-LAB 10.2 - HELP ON-LINE Prev Page Prev Page
T-LAB
Introduzione
T-LAB: cosa fa e cosa consente di fare
Requisiti e Prestazioni
Preparazione del Corpus
Preparazione del Corpus
Criteri Strutturali
Criteri Formali
File
Importare un singolo file...
Preparare un Corpus (Corpus Builder)
Aprire un Progetto Esistente
Impostazioni di Analisi
Impostazioni Automatiche e Personalizzate
Personalizzione del Dizionario
Analisi delle Co-occorrenze
Associazioni di Parole
Co-Word Analysis e Mappe Concettuali
Confronti tra Coppie
Analisi delle Sequenze e Network Analysis
Concordanze
Co-occurrence Toolkit
Analisi Tematiche
Analisi Tematica dei Contesti Elementari
Modellizazione dei Temi Emergenti
Classificazione Tematica di Documenti
Classificazione Basata su Dizionari
Testi e Discorsi come Sistemi Dinamici
Analisi Comparative
Analisi delle Specificità
Analisi delle Corrispondenze
Analisi delle Corrispondenze Multiple
Cluster Analysis
Singular Value Decomposition
Strumenti Lessico
Text Screening / Disambiguazioni
Vocabolario
Stop-Words
Locuzioni e Multi-Words
Segmentazione delle parole
Altri Strumenti
Gestione Variabili e Modalità
Ricerca Avanzata nel Corpus
Classificazione di Nuovi Documenti
Contesti Chiave di Parole Tematiche
Esportare Tabelle Personalizzate
Editor
Importare-Esportare una lista degli Identificativi
Glossario
Analisi delle Corrispondenze
Catene Markoviane
CHI quadro
Cluster Analysis
Codifica
Contesto Elementare
Corpus e Sottoinsiemi
Disambiguazione
Documento Primario
Forma e Lemma
Graph Maker
IDnumber
Indici di Associazione
Isotopia
Lemmatizzazione
Lessia e Lessicalizzazione
MDS
Multiwords
N-grammi
Naïve Bayes
Normalizzazione del Corpus
Nuclei Tematici
Occorrenze e Co-occorrenze
Omografia
Parole Chiave
Polarità fattoriali
Profilo
Soglia di Frequenza
Specificità
Stop Word List
Tabelle Dati
TF-IDF
Unità di Analisi
Unità di Contesto
Unità Lessicale
Valore Test
Variabili e Modalità
Bibliografia
www.tlab.it

Impostazioni Automatiche e Personalizzate


La scelta delle impostazioni automatiche (A) o personalizzate (B) riguarda la lista delle Parole Chiave utilizzate in tutte analisi effettuate con T-LAB.
Tale scelta è reversibile fino a quando l'utilizzatore non effettua interventi che modificano il Dizionario del corpus.

A) IMPOSTAZIONI AUTOMATICHE

La scelta delle impostazioni automatiche comporta che la lista delle parole chiave includa fino a un massimo di 5000 unità lessicali selezionate automaticamente da T-LAB e appartenenti alle categorie grammaticali che sono più dense di significato: nomi, verbi, aggettivi e avverbi.

Il criterio di selezione utilizzato da T-LAB varia in funzione del tipo di corpus in analisi.

Se il corpus è costituito da un unico testo, le unità lessicali selezionate sono semplicemente quelle con i più elevati valori di occorrenza.

Se il corpus è costituito da due o più testi T-LAB applica il seguente algoritmo:

a) seleziona le parole con valori di occorrenza superiori alla soglia minima;

b) calcola i valori del TF-IDF o applica il test del CHI quadro a tutti gli incroci di ogni parola selezionata per tutti i testi in analisi (N.B.: Nel caso del CHI quadro, il numero massimo dei testi è 500);

c) seleziona le parole con i valori maggiori nel metodo utilizzato (TF-IDF o CHI quadro), ovvero seleziona quelle parole che, nel corpus, fanno la differenza.

N.B.:

- Nel caso il corpus sia costituito da due o più testi, l'utilizzatore può scegliere il criterio di selezione (CHI quadro o TF-IDF) nella fase di importazione (vedi immagine seguente).

- Quando è attiva l'opzione di impostazioni automatiche la tabella con la lista delle Parole Chiave include una colonna 'T-LAB' che indica la rilevanza di ogni item secondo il criterio selezionato (vedi immagine seguente).

 

B) IMPOSTAZIONI PERSONALIZZATE

La scelta delle impostazioni personalizzate consente all'utilizzatore di selezionare, ridenominare e raggruppare le unità lessicali (parole, lemmi o categorie) da includere nelle successive analisi T-LAB.

Nella tabella di riferimento è riportata la lista (lista 1) delle unità lessicali con valori di occorrenza uguali o superiori alla soglia prefissata.
Alcune di queste, quelle marcate con un segno "v"
, fanno parte di una sub-lista (lista 2) creata da T-LAB (vedi impostazioni automatiche).

In funzione delle analisi che intende effettuare, l'utilizzatore può decidere se usare/modificare la lista (1) o la lista (2).

In entrambi i casi le operazioni possibili sono le seguenti:

  • modificare il valore di soglia;
  • selezionare i lemmi da mettere fuori analisi;
  • ripristinare l'uso di uno o più lemmi;
  • selezionare/deselezionare gli item da utilizzare.

Un click su uno dei pulsanti "(1)" o "(2)" abilita l'opzione personalizzata delle impostazioni di analisi (vedi immagine seguente).

Le opzioni che riguardano gli interventi sui singoli lemmi sono accessibili tramite il tasto destro del mouse selezionando un qualunque item della tabella .

La ridenominazione di un singolo lemma va effettuata nel modo seguente:
1- accertarsi che sia attiva l'opzione "RINOMINARE";
2- cliccare su un item della lista;
3- scegliere una delle parole o digitare una label a propria scelta;
4- cliccare su "RINOMINA".

I raggruppamenti di due o più lemmi vanno effettuate nel modo seguente:
1- selezionare la modalità "RAGGRUPPARE";
2- cliccare su due o più item della lista;
3- scegliere uno dei lemmi o digitare una label a propria scelta;
4- cliccare su "RINOMINA".

Ulteriori opzioni sono attivabili usando il tasto destro nel box con gli item da rinominare/raggruppare (A) o nel box con i 'lemmi eliminati' (B).

In particolare, quando - nel caso (A) - viene selezionata l'opzione 'Key-Word-in-Context', è possibile accedere automaticamente allo strumento Concordanze e verificare i contesti di occorrenza dei vari item (vedi immagine seguente).

Uno specifico pulsante (vedi sotto) consente di importare liste personalizzate di parole chiave.
Ogni lista da importare (file MyList.diz) può includere fino a 10.000 records (min 20). Ogni record (o riga) della lista deve essere costituito da una parola (Max 50 caratteri) e non deve contenere né spazi vuoti né segni di punteggiatura.
Un modello di file MyList.diz viene creato automaticamente da T-LAB ogni volta che viene salvata una lista delle parole chiave (si veda l'apposito pulsante in basso a sinistra).


Le impostazioni di analisi, ovvero sia la selezione dei lemmi (o categorie) che il dizionario in uso, possono essere salvate e ripristinate usando gli appositi pulsanti ( Archiviare o Ripristinare). Ciò significa che lo stesso corpus - senza bisogno di ulteriori importazioni - può essere analizzato con vari dizionari e con diverse selezioni delle parole chiave. Ciò fino a un massimo di 10 diverse impostazioni.

In T-LAB, inoltre, è previsto che le impostazioni possono essere riviste in più sessioni, anche con vari utilizzi della funzione Personalizzazione del Dizionario.