Esistono in rete innumerevoli risorse per lo studio della lingua cinese e lo sviluppo di software ad hoc per l’analisi dei testi. Tra queste, i corpus open source più comuni come CeDict, e altri contenenti informazioni sul PoS e dati ontologici. Tutte le risorse del consorzio Unihan per l’indicizzazione e la classificazione di tutti i caratteri del CJK codificati finora, tutti i dataset di Jim Breen sullo studio dei Kanji, gli estratti (KRad) per lo studio sulla decomposizione dei caratteri, dataset fonetici di vario tipo, di scrittura (ordine dei tratti) dei caratteri, algoritmi per il riconoscimento del carattere durante la scrittura, etc. Gli strumenti che possono essere raccolti, oltre che costituire un supporto digitale importante per lo studio del cinese possono rivelarsi un’ottima base di conoscenza per lo sviluppo di programmi di apprendimento personalizzati, studi analitici sui testi e studi statistici riguardanti caratteri e componentistica. Tramite questi ho contribuito al progetto sulla decomposizione dei caratteri cinesi (*) su wikicommons completando e rendendo consistenti le tavole con gli standard adottati per la codifica dei caratteri, e inizializzando le tavole con i nuovi set di caratteri previsti nell’ultima versione dell’unicode.
Strumenti per il supporto allo studio
Alcuni strumenti per il supporto allo studio della lingua cinese sono stati inseriti come moduli all’interno del software Chinese Supporter. Eccone alcune caratteristiche:
Modulo di ricerca in stile omnibox. Consente di (i) effettuare ricerche sul dizionario, sia classiche che con l’aggiunta di informazioni su caratteri singoli, decomposizione, contesto d’utilizzo, audio della pronuncia e altre informazioni contestuali; (ii) attivare una serie di funzionalità di supporto allo studio selezionabili dal menu Assistant, come ad esempio l’apertura automatica in seguito alla ricerca, automatizzabile mediante copia in memoria di una parola in cinese; (iii) ottenere una finestrella di supporto sempre in primo piano, utile per la ricerca o la consultazione dei dizionari durante lo studio;
- Le funzionalità selezionabili e componibili attraverso l’interfaccia sono:
Dizionario: effettua ricerca e traduzione di parole e caratteri. Per ogni parola in cinese mette in evidenza i caratteri che la compongono e le parole che la contengono; per le parole o i caratteri cercati vengono presentate tutte le informazioni sui differenti significati e pinyin.
Decomposizione: per ognuno dei caratteri vengono mostrate le informazioni, e per ogni carattere viene mostrata la decomposizione per radicale, la decomposizione grafica e il conteggio del numero dei tratti totale e per componenti.
Pronuncia: Il programma pronuncia la parola cercata. È possibile tramite l’omnibox sentire la pronuncia cinese partendo direttamente dalla scrittura del pinyin con i toni (e.g., xiu1 xi5). Se non viene inserito il tono viene recitato tutto il bopomofo della sillaba. Utile per confrontare immediatamente pronuncie molto simili (e.g., chan, chang, cheng).
Esempi: su un tab parallelo, di ogni parola o carattere cercato vengono mostrati gli esempi di utilizzo, divisi per livello HSK e raccolti automaticamente da un database interno di circa 20.000 frasi. Ogni esempio è riportato con il PinYin e una traduzione per consentire una comprensione migliore del contesto di utilizzo di una parola.
Apertura siti contestuale: consente di aprire le pagine web relative ai caratteri selezionati. Se si vuole che queste pagine siano aperte automaticamente basta selezionare il checkbox, altrimenti basta cliccare con il tasto destro.
Supporto allo studio: consente di effettuare la ricerca semplicemente copiando nella memoria del pc (clipboard) la parola in cinese. Associata all’apertura contestuale dei siti, alla ricerca sul dizionario, alla pronuncia questa funzionalità vi consente di aumentare l’efficienza dello studio sopratutto su un documento digitale.
Altre funzionalità, non legate alla omnibox:
Brain Pusher: una volta raccolti i caratteri che creano più difficoltà, essi si possono salvare all’interno del Brain Pusher. Questo funzionerà in due modalità, mostrando prima il carattere e poi il suo significato, la pronuncia, gli esempi di utilizzo, nel caso si voglia memorizzare il significato del carattere, la sua pronuncia, etc. e viceversa, nel caso si voglia memorizzare la traduzione di una parola cinese. Tutto in maniera temporizzata, senza che si debba utilizzare la tastiera per cambiare la scheda.
Ricerca per componenti: Grazie agli studi sulla decomposizione grafica, ho creato un modulo per la ricerca a partire dalle componenti di base dei caratteri, siano essi radicali, o tutti i componenti grafici di base, non reperibili nei comuni dizionari.
Text Annotator: effettua l’annotazione in pinyin del testo cinese (utilizza il programma anki).
Sentence Speaker: legge un set di frasi selezionate da insiemi predefiniti divisi per livello HSK, o numeri in un range predefinito, e mostra caratteri e traduzione. Utilissimo per allenare l’orecchio alla pronuncia, o per esercitarsi a riscrivere il testo.
Message Encryptor: converte un testo in cinese, in un altro testo che utilizza caratteri completamente diversi, ma che hanno la stessa pronuncia. Leggendo questo testo senza alcun significato, si potrà comunque comprendere quello che era il testo originale.
Moduli secondari:
Anki Translator: un modulo per la traduzione dei set di caratteri anki in formato csv per il riutilizzo nei fogli di calcolo e per la creazione di fogli di studio.
Press Space on Anki: un modulo per automatizzare lo studio su anki senza dover interagire con mouse a tastiera.
Analisi statistiche su CCD: (Show Statistics CCD, Show Statistics Clipboard, PinYin Homophoneme Tones statistics): strumenti di analisi statistica su set di caratteri. Consentono di costruire tavole di frequenza, non solo di tipo classico ma anche informazioni sulla componentistica e sui radicali.
Strumenti e articoli correlati:
Decomposizione dei caratteri
Grammatica
Sto lavorando alla scrittura di un compendio grammaticale compatto, ordinato e il più possibile esaustivo. Ci sono, oltre alla grammatica, dei cosiddetti quicksheet, ovvero delle mappe di apprendimento sintetiche o dei prontuari di regole che accorpino lo studio di concetti chiave, e tabelle di studio per gruppi concettuali come ad esempio, localizzatori, comparativi, le regole, le forme e le copule per la forma interrogativa. Ho raccolto ed elencato le tecniche più interessanti di memorizzazione e di utilizzo della lingua, anche nel settore fonetico. A livello di base di dati sono raccolte in gruppi tutte le preposizioni, gli avverbi più comuni, e i lemmi collegati a regole di particolari, come frasi a perno, verbi a doppio oggetto, etc. Ho in progetto di aggiungere informazioni sintetiche su storia e usanze; sebbene non debba diventare un trattato esaustivo sulla Cina, è comunque importante fornire a chi vuole studiare la lingua un’idea del contesto storico e sociale nel quale si sviluppa, per trovarsi preparati ad affrontare un confronto nella vita reale e non scolastica.
Filed under: Bulletin, Labels, Publishing, Software Development, Solutions | Tagged: cinese | 1 Comment »