Om at holde liv i truede sprog online

Dette indlæg er en del af vores reportage fra Global Voices Summit i Nairobi, Kenya, 2012 [da]

Keeping Endangered Languages Alive #GV2012

Vil vi alle samles omkring engelsk og kinesisk online? Eller vil teknologien hjælpe os til at understøtte vores mange modersmål?

Eddie Avila, leder af Rising Voices, peger på forskellen mellem truede sprog og underrepræsenterede sprog. Tre af de tilstedeværende panelister arbejder med sidstnævnte inden for afrikanske sprog, som proportionelt set ikke er tilstrækkeligt repræsenteret online. De unge har behov for at se deres sprog afspejlet på nettet og i lokaltilpasset software (som OpenOffice) for at forstå, at deres sprog hører fremtiden til, og ikke er et levn fra historien.

Boukary Konate

Boukary (@fasokan, blogger på Fasokan.com) er fra Mali og taler bambara, det ene af ca. femten sprog som tales i Mali. Bambara tales af omtrent 80% af befolkningen. Undervisningssystemet bygger først og fremmest på dette modersmål, og i øvrigt på fransk og engelsk. Boukary mener, det er afgørende at holde liv i sit modersmål på nettet, så han blogger på både bambara og fransk. Sprog udbredes til landsbyerne gennem alfabetiseringskurser, så Boukay har udarbejdet nogle kurser, som skal opfordre børn til at fortælle historier i skrift og tale på deres oprindelige sprog.

Bambara bygger på fire meget unikke bogstaver, der ikke findes på vestlige tastaturer. Men der er andre bogstaver på almindelige QWERTY-tastaturer, såsom netop bogstavet Q, som ikke bruges på bambara, så der kan nemt foretages udskiftninger af enkelte bogstaver manuelt. Der er også blevet udviklet en app til Facebook og Twitter, som tillader folk at skrive statusopdateringer og tweete på bambara.

Mon softwarebaserede touch-screen tastaturer kan vise sig nyttige over for begrænsningerne ved fysiske tastaturer designet udelukkende til de dominerende sprog? (Se ANLOC's side for sprog-tastaturer for mere om det). En anden løsning er Accentuate.us. Det er en fremragende udvidelse til Firefox, som “tillader dig at skrive hurtigt og nemt på mere end 100 forskellige sprog uden brug af ekstra tasteanslag eller et specielt tastatur.”


Abdoulaye Bah

Abdoulaye blogger for Global Voices’ fransktalende gruppe. Han er fra Guinea, men bor i Italien og Frankrig. I løbet af sit liv har han talt otte sprog, men det han kan dårligst, er hans eget modersmål, fulani. Han har haft mere brug for de andre sprog, som det af praktiske grunde har været et krav at kunne tale. Fula tales som første- eller andetsproget i ikke mindre end 18 afrikanske lande, herunder Guinea, hvor 40% af befolkingen taler det, og desuden Mauretanien, Cameroun, Tchad, samt dele af Etiopien.

Mange af de problemer som er forbundet med dette sprog, udspringer fra, at der ikke bliver undervist i det i skolen. Folk lærer at skrive det gennem individuel undervisning, eller slet ikke. For Abdoulaye er blogs en af de eneste måder at holde liv i sproget på. Der er mange blogs på fulani. Også i online videoer er sproget repræsenteret, hvormed man undviger den udfordring der ligger i, at der er flere mennesker som taler sproget, end dem som skriver og læser det.


Oliver Stegen

Oliver komer oprindeligt fra Tyskland, men han har været bosat i Østafrika gennem mange år (hans modersmål hører absolut ikke til blandt de truede). Hans engagement for Global Voices er ikke som blogger, men derimod som lingvist hos SIL, en non-profit organisation der arbejder med modersmål og oversættelse.

Rangi er ét ud af 120 sprog, som tales i Tanzania, og er historisk set udelukkende et talesprog. Det globale samfund for lingvister ville gerne dokumentere en skriftlig udgave af rangi, og Oliver brugte derfor flere år i Tanzania på at tale med regeringsfolk og lærere om at lave optagelser af sproget. Han skrev lingvistisk relaterede artikler i akademiske tidsskrifter, men fandt hurtigt ud af, at den form for udgivelser ikke ville hjælpe stort til det truede sprogs overlevelse. Istedet arbejdede han sammen med lærerne på at etablere sprogundervisning i landsbyerne. Men sproget vandt relativt set stadig ikke meget indpas.

Det var i 2006, at Oliver opdagede borgermedierne. Han begyndte at skrive statusopdateringer på Facebook på rangi — til sine venners forargelse. Han var end ikke i stand til at overbevise de rangi-talende om at benytte rangi på nettet, fordi mange af deres venner talte engelsk. Sprog synes at være påvirket på både godt og ondt af netværket, på samme måde som de sociale netværkstjenester selv er det.

 

Så begyndte Oliver at tweete på rangi, og i den forbindelse opdagede han indigenoustweets.com, hvor Kevin Scannell identificerer og sporer tweets skrevet på underrepræsenterede sprog. På listen er over 100 mindre sprog repræsenteret, ligesom de mest inflydelsesrige brugere (målt på andelen af followers) vises. Olivers tweets på rangi kom på listen. Han overlod Kevin 150 siders tekst på rangi, som blev integreret i softwaren, således at sproget nu kan genkendes automatisk, når det bliver brugt online.

Oven på flere års forsøg startede Oliver en Facebookgruppe for rangi-talende, og denne voksede til 26 medlemmer inden for to timer. Det forudgående arbejde med alfabetisering viste sit værd, i den forstand, at folk nu var i stand til at skrive på deres sprog. Gruppen tæller nu et godt stykke over 300 medlemmer, og der er daglig aktivitet både inden for Tanzania og på verdensplan. Det lykkedes bl.a. en rangi-talende fra Miami at bruge gruppen til at komme i kontakt med en rangi-talende fra Minnesota, som var på forretningsrejse. Nogle af udfordringerne kommer af de specielle tegn der bruges på rangi, og som det er svært at gengive online. Accentuate.us er et fremragende redskab, men rangi bygger på helt unikke tegn.

Oliver sidder desuden i Wikimedias sprogkomité, og han er redaktør for Wikipedia på swahili. Der kører en interessant debat om swahili, som bestemt ikke er et truet sprog, men som er underrepræsenteret på nettet. Global Voices har haft svært ved at finde oversættere til swahili, med det til følge, at der undertiden er gået måneder uden nye artikler på Lingua-sitet [sw] for dette sprog.

I sidste uge lancerede Google et initiativ kaldet EndangeredLanguages.com i samarbejde med Alliancen for Lingvistisk Diversitet. Den første udfordring for dette projekt er at foretage en optælling af truede sprog. Google-initiativet oplister over 3000 sprog, af hvilke nogle må betegnes som underrepræsenterede snarere end truede. Kun 285 sprog er repræsenteret ved en udgave på Wikipedia (og mange færre af disse er en decideret robust udgave). Hullet mellem Googles 3054 sprog og de 285 Wikipedia-udgaver viser omfanget af den udfordring det er, at få de truede og underrepræsenterede sprog online.

En gruppe som hører hjemme i Rumænien, arbejder på at finde nyttig software og står over for opgaver som at opfinde nye ord til moderne ting såsom computere. Rising Voices uddeler mikrobevillinger for at styrke folks stemme i de underrepræsenterede samfund, og det indebærer tre bevillinger til grupper der arbejder med at puste liv i underrepræsenterede sprog:

  • Aché i Paraguay
  • Quechua i Peru
  • Powahattan, der betragtes som et allerede uddødt sprog (uden nogen aktivt talende), men som én mand rekonstruerer og underviser i.

Lingvistiske sammenløb online

Det viser sig, at når det drejer sig om sprogbrug online, så forfalder mange til at bruge de mest almindelige og dominerende sprog. En person skrev på en vens væg på quechua, men fik et svar tilbage på spansk. Især på Facebook skriver folk på det sprog som flest af deres venner kan forstå. Oliver foreslår, at en mulig omgang med dette fænomen er at skabe bestemte rum online, som dedikeres til brugen af et underrepræsenteret sprog. Hvis folk i et rangi-forum kun skriver på swahili, skal de afvises. Sprognormer kan godt tvinges igennem på online fora ligesom andre normer for samværet.

I takt med at verden knyttes tættere sammen har folk en tendens til at lade sig indordne. I Afrika flytter folk ind til byerne og lærer engelsk og især kinesisk. Selv sprog som ikke tidligere var truede, bliver det fordi nye generationer i byerne ikke lærer eller bruger deres modersmål. Ved disse paneldiskussioner taler vi engelsk, og således er konceptet om lingua franca ikke noget nyt.

En person blandt publikum fortæller en lingvistisk vittighed: Finsk er sådan at svært sprog, at når to finner vil sige noget til hinanden hurtigt, så bruger de engelsk istedet.

En anden vittighed: Hvilket sprog er tættest på himlen, ungarsk eller finsk?
Det er ligegyldigt, de tager begge en evighed at lære.

Er automatisk oversættelse en mulighed?

Google Chrome, og nu også Gmail, tilbyder integreret oversættelse. Bing udbyder oversættelse af statusopdateringer på Facebook. Det er ikke perfekt, men det hjælper os til at forstå meningen i budskabet. Og det virker OK mellem ungarsk og finsk. Men det er forfærdeligt til swahili. Vi har brug for mange menneskelige oversættere til at forbedre algoritmerne bag de automatiske oversættelser. Og vi kommer næppe til at se en automatisk mulighed for truede sprog, når vi knap har menneskelige resourcer til at oplære maskinerne.

Dette indlæg er en del af vores reportage fra Global Voices Summit i Nairobi, Kenya, 2012 [da]

1 Kommentar

Deltag i debat

Skribenter, vær venlige at Log på »

Retningslinjer

  • Alle kommentarer bliver evalueret af en administrator. Send ikke din kommentar mere end én gang, ellers er der risiko for, at den bliver identificeret som spam.
  • Vær venligst respektfuld over for andre. Kommentarer, som indeholder hadefuld tale, modbydeligheder og personlige angreb vil ikke blive godkendt.