This website doesn't use cookies to identify you.(More info)
email
en es fr it

PRODOTTO / News (demo, cronologia)

T-LAB Plus 2016 è stato rilasciato il 22 aprile 2016. (New: T-LAB Plus 2018 )

Tra i vari cambiamenti introdotti segnaliamo i seguenti:

1 - Undici diversi formati di file - documenti PDF inclusi - possono essere ora processati direttamente da T-LAB, sia come singoli file che come una collezione di documenti.

N.B.:
- I file PDF solo immagine devono prima essere processati con un software OCR;
- I file HTML possono essere importati solo tramite il modulo Corpus Builder.

2 - Ora il software consente l'uso di ogni strumento attraverso due tipi di profili: principiante ed esperto. Quando è selezionato il primo (cioè 'principiante'), l'utilizzatore può realizzare ogni tipo di analisi con le impostazioni di default e senza visualizzare le opzioni avanzate del software.

3 - Ogni volta che viene usato uno strumento per l'analisi delle co-occorrenze o per l'esplorazione di cluster, un nuovo strumento denominato Graph Maker consente di creare ed esportare nuovi tipi di grafici dinamici, alcuni dei quali sono realizzati con l'ausilio della libreria D3 .

4 - Ogni volta che viene utilizzato uno strumento per esplorare somiglianze e differenze tra sottoinsiemi del corpus o tra cluster tematici è ora disponibile un nuovo strumento che consente di visualizzare una preview dei risultati con grafici del tipo tree map.

5 - Il clustering non supervisionato di segmenti di testo e di documenti per l'analisi tematica può essere ora realizzato anche con un nuovo algoritmo che si aggiunge al bisecting Kmeans implementato in T-LAB più di dieci anni or sono.
Il nuovo algoritmo, per inizializzare la procedura k-means, fa uso del metodo PDDP (Principal Direction Divisive Partitioning) proposto da Daniel Boley (1998).

In questo modo l'utilizzatore di T-LAB con un profilo esperto è messo in condizione di confrontare differenti soluzioni dello stesso problema, cioè - ad esempio - confrontare la qualità dei cluster ottenuti tramite l'applicazione di due differenti algoritmi alla stessa tabella dati.



T-LAB Plus è stato rilasciato il 14 Settembre 2015.

T-LAB Plus è un nuovo prodotto software realizzato attraverso la reingegnerizzazione dell'ultima versione di T-LAB 9.1 e costituisce una nuova base per futuri sviluppi.

La tabella seguente compara le principali differenze tra le due versioni di T-LAB attualmente disponibili:

  T-LAB Plus 2015 T-LAB 9.1
Formato dei file
in input
testi in tutte le lingue, incluse quelle che usano ideogrammi
(formato UTF-8)

soltanto testi in caratteri latini
(formato ASCII/ANSI)

Dimensioni massime
di un corpus

90 MB
(pari a circa 55.000 pagine in formato testo)

30 MB
(pari a circa 18.000 pagine in formato testo)

N.B.:
- Il Cinese, il Giapponese e alcune altre lingue spesso non hanno delimitatori (cioè spazi e/o segni di punteggiatura) che consentono di distinguere le singole parole. In questi casi, prima di importare un testo con
T-LAB Plus, l'utilizzatore dovrà effetturare una segmentazione del testo utilizzando software ad hoc che - di solito - sono disponibili gratuitamente (vedi http://nlp.stanford.edu/software/segmenter.shtml).


- Le due versioni di
T-LAB usano due diversi motori di database; di conseguenza, i progetti di analisi realizzati con T-LAB 9.1 non possono essere direttamente importati in T-LAB Plus (e viceversa).

Tra le numerose nuove funzionalità implementate in T-LAB Plus segnaliamo le seguenti:

  • Uno strumento molto flessibile e performante denominato Text Screening consente di editare un qualunque file corpus, di creare liste di parole e n-grammi con le rispettive occorrenze, di esplorare intorni a lunghezza variabile delle parole in elenco, di importare e applicare liste personalizzate di multiword;

  • Quando viene importato un corpus in una lingua per la quale - al momento - T-LAB Plus non include la lemmatizzazione automatica (cioè in una lingua che non sia Italiano, Inglese, Spagnolo, Francese, Portoghese o Tedesco), l'utilizzatore può selezionare/usare liste di stop word in venticinque lingue diverse e queste liste, così come le liste delle parole-chiave e delle multiword, possono essere agevolmente personalizzate;

  • Tutti gli strumenti per gestire liste di parole-chiave , per personalizzare i dizionari e per generare concordanze sono ora molto integrati tra loro e molto più semplici da usare;

  • L'uso del tasto-destro sulle varie tabelle abilita molte nuove opzioni;

  • Molti strumenti di analisi consentono di creare nuovi dendrogrammi che sintetizzano le relazioni di cooccorrenza/similarità tra parole-chiave;

  • Diversi strumenti di analisi consentono di creare mappe che rappresentano le relazioni tra temi emergenti sia usando il Multidimensional Scaling che l'Analisi delle Corrispondenze;

  • Tutti gli strumenti per l'Analisi delle Corrispondenze includono un nuovo pulsante che consente di realizzare immediatamente una Cluster Analysis con differenti metodi;

  • Gli algoritmi per la lemmatizzazione automatica e per la selezione automatica delle parole-chiave sono stati migliorati;

  • La maggior parte degli strumenti di analisi hanno un nuovo layout.


Di seguito sono riportate alcune immagini che consentono di apprezzare alcune delle nuove funzionalità di T-LAB Plus.

1- Tre output ottenuti analizzando testi in Cinese, Russo e Arabo:

2 - Uso dello strumento Text Screening:

3 - Lavorare con liste di Stop-Word diverse da quelle che T-LAB tratta mediante la lemmatizzazione automatica:

4- Strumenti integrati per la selezione delle parole-chiave e per la personalizzazione dei dizionari:

5 - Nuove opzioni con l'uso del tasto destro del mouse:

6- Nuovi dendrogrammi:

7- Mappe di temi:

8 - Dall'Analisi delle Corrispondenze alla Cluster Analysis:

9 - Nuovi layout degli strumenti T-LAB (esempio Analisi delle Specificità)



Clicca qui per saperne di più.