T-LAB Home
T-LAB 10.2 - HELP ON-LINE Prev Page Prev Page
T-LAB
Introduzione
T-LAB: cosa fa e cosa consente di fare
Requisiti e Prestazioni
Preparazione del Corpus
Preparazione del Corpus
Criteri Strutturali
Criteri Formali
File
Importare un singolo file...
Preparare un Corpus (Corpus Builder)
Aprire un Progetto Esistente
Impostazioni di Analisi
Impostazioni Automatiche e Personalizzate
Personalizzione del Dizionario
Analisi delle Co-occorrenze
Associazioni di Parole
Co-Word Analysis e Mappe Concettuali
Confronti tra Coppie
Analisi delle Sequenze e Network Analysis
Concordanze
Co-occurrence Toolkit
Analisi Tematiche
Analisi Tematica dei Contesti Elementari
Modellizazione dei Temi Emergenti
Classificazione Tematica di Documenti
Classificazione Basata su Dizionari
Testi e Discorsi come Sistemi Dinamici
Analisi Comparative
Analisi delle Specificità
Analisi delle Corrispondenze
Analisi delle Corrispondenze Multiple
Cluster Analysis
Singular Value Decomposition
Strumenti Lessico
Text Screening / Disambiguazioni
Vocabolario
Stop-Words
Locuzioni e Multi-Words
Segmentazione delle parole
Altri Strumenti
Gestione Variabili e Modalità
Ricerca Avanzata nel Corpus
Classificazione di Nuovi Documenti
Contesti Chiave di Parole Tematiche
Esportare Tabelle Personalizzate
Editor
Importare-Esportare una lista degli Identificativi
Glossario
Analisi delle Corrispondenze
Catene Markoviane
CHI quadro
Cluster Analysis
Codifica
Contesto Elementare
Corpus e Sottoinsiemi
Disambiguazione
Documento Primario
Forma e Lemma
Graph Maker
IDnumber
Indici di Associazione
Isotopia
Lemmatizzazione
Lessia e Lessicalizzazione
MDS
Multiwords
N-grammi
Naïve Bayes
Normalizzazione del Corpus
Nuclei Tematici
Occorrenze e Co-occorrenze
Omografia
Parole Chiave
Polarità fattoriali
Profilo
Soglia di Frequenza
Specificità
Stop Word List
Tabelle Dati
TF-IDF
Unità di Analisi
Unità di Contesto
Unità Lessicale
Valore Test
Variabili e Modalità
Bibliografia
www.tlab.it

Segmentazione delle parole


Questo strumento T-LAB può essere utilizzato prima di importare qualsiasi testo (*) cinese o giapponese che non abbia delimitatori (cioè spazi e / o segni di punteggiatura) tra le parole.
(*) Il testo da processare può essere costituito da un singolo documento o da una collezione di documenti che includono variabili categoriali.

Il suo utilizzo è molto semplice (vedi immagine seguente):

(1) selezionare un qualsiasi file;
(2) scegliere il nome del progetto;
(3) selezionare la lingua del testo;
(4) cliccare su 'Segmentare'.
Come risultato, verranno aggiunti spazi vuoti tra le parole.


Successivamente, se si vuole procedere con l' importazione, basta rispondere 'Sì' alla domanda "Vuoi importare il corpus segmentato?" (vedi immagine seguente).

N.B.: Quando si desidera preparare un corpus costituito da vari testi che comprendono le linee di codifica (cioè variabili categoriali), si consiglia di procedere nel seguente modo:
1- 'Assemblare' i testi non segmentati (*) mediante lo strumento Corpus Builder e 'Salvare' il file corpus;
2 -
Importare il corpus appena creato mediante lo strumento Segmentazione delle Parole; quindi procedere come spiegato in precedenza.
(*) Ciò significa che, quando si prepara il corpus, non è necessario segmentare ogni singolo file in anticipo.