SPROGMUSEET

Redaktør: Ole Stig Andersen

Fra Wittgenstein til Ontology Engineering 1: Analytisk Sprogfilosofi og Moderne Kunstig Intelligens

Hvor langt er vi nået?

Hvis man kort gør status på den sproglige side af kunstig intelligens i dag, er der mange avancerede løsninger som imponerer ved deres tekniske fremskridt og praktiske anvendelighed. Computere kan selv oversætte tekst fra et sprog til et andet, tæve os i skak og Jeopardy og i visse tilfælde endda kommunikere på vores præmisser indenfor begrænsede emner, såsom at svare på spørgsmål om rejsetider og lignende over telefonen.

Alligevel hersker der blandt forskere i kunstig intelligens og sprogteknologi forholdsvis bred enighed om at målet om at udvikle kunstig intelligens der kan simulere en form for bevidsthed gennem kommunikation via menneskelige sprog, også kaldet ’natursprog’, er stødt på en naturlig grænse. Eksempler på gnidningsfri kommunikation mellem mennesker og computere via natursprog lader simpelthen vente på sig. Eksempelvist burde en søgning på Google fungere som en afslappet samtale – ikke en programmeringsopgave i semantisk snedighed og forståelse af den bagvedliggende algoritmes underliggende funktionalitet.

Wittgenstein

Ludwig Wittgenstein (1889-1951)

Det er som om denne type forskning har nået et sidste plateau, hvorfra man ikke kan komme videre. Spørgsmålet er så om der kan findes en helt ny vej – en ny tilgang til den sprogteknologiske side af kunstig intelligens, og om den i så tilfælde vil kunne udvise potentiale for nye og mere overbevisende resultater end det vi kender til i dag. Vores rejse mod dette mål starter ved den anerkendte, østrigske sprogfilosof Ludwig Wittgenstein.

Wittgensteins tidlige sprogforståelse

Kendetegnende for Wittgenstein er måden hvorpå hans liv kan opdeles på i to komplet divergerende perioder og hovedværker. Hver repræsenterer de et syn på det menneskelige sprog som på mange måder er komplet uforenelige med hinanden.

I sin tidlige periode var Wittgenstein dybt optaget af at afdække sprogets underliggende logiske form. Man kan sige at han forsøgte at finde ’matematikken i sproget’ ved udelukkende at forholde sig til sprogets deskriptive egenskaber, og dette indenfor de strengeste logisk formaliserede rammer. En sætnings mening var udelukkende defineret ved dens sandhedsbetingelser; dvs. en forståelse af hvorledes verden ville se ud hvis den pågældende sætning var sand.

Dette deskriptive og logisk-matematiske syn på det menneskelige sprog, udmøntede sig i Wittgensteins første hovedværk ”Tractatus Logico-Philosophicus”. Værket er notorisk utilgængeligt for den gængse læser, og opstiller i hierarkisk punktform et regelsæt der beskriver hvorledes sproget bør anvendes, og i særdeleshed hvorledes det ikke bør anvendes.

Sagt i al korthed, viser Wittgenstein os hvorledes filosofiske problemer blot er et resultat af en forkert anvendelse af sproget, hvor der fejlagtigt fremsættes spørgsmål som ikke kan bringes på en logisk form. Konklusionen på værket lyder derfor også at ”Det, hvorom man ikke kan tale, om det må man tie“. Ifølge Wittgenstein er ”det hvorom man ikke kan tale…” så de sproglige instanser som ikke i sig selv kan bringes på en logisk form, som for eksempel metafysiske eller eksistentielle spørgsmål som ’hvad er meningen med livet?’.

Hovedkritikken af værket er koncentreret omkring den logiske atomisme som bliver afgørende for mekanikken i Wittgensteins tidlige sprogforståelse. Wittgenstein hævder i Tractatus at sammenhængen mellem sproget og den verden som det beskriver, er ganske entydig via relationen mellem virkelighedens og sprogets ’mindste bestanddele’. Problemet er bare at Wittgenstein er totalt ude af stand til at præcisere hvad disse mindste bestanddele skulle være. Herved kan man til dels sige at selve fundamentet for Tractatus falder sammen.

Status på den moderne sprogforståelse

Hvis vi et øjeblik vender tilbage til det dominerende syn på sproget indenfor nutidens forskning, så er det interessant at se hvorledes der er mange fællestræk med Tractatus. For eksempel er der i dag et overhængende fokus på den beskrivende del af sproget der blot sætter navn på de ting og begreber vi kender til. Som vi senere skal se, er dette en mangelfuld sprogforståelse, der ikke formår at indkapsle samtlige relevante aspekter af et natursprogs dynamik og mangfoldighed.

niveauer

I dag er der blandt natursprogssystemer en udbredt tendens til at anvende statistisk funderede løsninger som fokuserer på de nederste niveauer af sproganalyse, såsom morfologi som beskæftiger sig med de enkelte ords struktur, samt grammatik og syntaks som beskæftiger sig med hvorledes disse ord kan arrangeres i forhold til hinanden efter gængse regler.

Den mest afgørende, fælles fejlslutning må dog være antagelsen om at nøglen til en givtig systematisering af sproget skulle ligge i en form for logisk atomisme der fokuserer på sprogets mindste bestanddele. På samme måde som i Tractatus, er nutidens sprogteknologiske løsninger nødt til at finde en systematik i sproget, så det kan håndteres af en computer. Den mest udbredte strategi hertil, som man ser anvendt i dag, kan med rette anses for en type af logisk atomisme idet den næsten udelukkende arbejder med sprogets mindste bestanddele; dvs. enkelte bogstaver og ord.

Der er helt konkret tale om statistisk funderede løsninger, som for eksempel kan oversætte en sætning ved at regne på sandsynligheden af en række ord- eller bogstavkombinationer mellem to forskellige sprog. De fleste har dog oplevet at selv de bedste oversættelsesprogrammer fungerer ganske utilfredsstillende. Den logiske atomisme som er indeholdt i den førnævnte moderne sprogforståelse, består altså helt konkret i et fejlbehæftet fokus på kombinatorikken af elementer fra de allernederste niveauer af sproganalyse. Spørgsmålet er hvad alternativet til denne logiske atomisme så er. Svaret finder vi i den sene Wittgensteins forkastelse af sine egne tidligere teorier i hans andet centrale hovedværk: ”Filosofiske Undersøgelser”.

Wittgensteins lektie

I ”Filosofiske Undersøgelser” forkaster Wittgenstein sin tidligere tro på logikken og ideen om logisk atomisme. I stedet for at anse sproget som en strengt logisk affære hvis hovedformål udelukkende er at beskrive verden, skifter han fokus til hverdagssproget og interpersonel kommunikation indenfor en social og kulturel kontekst. Meningen med sproget er ikke længere sandhedsbetingelser, men dets egentlige, kontekstuelle brug.

Denne nye sprogforståelse udmønter sig i det Wittgenstein kalder ”sprogspil”. Al sprogbrug er baseret på sprogspil, som er endnu mere grundlæggende end sproget selv. Wittgenstein eksemplificerer dette ved at gøre os opmærksomme på, at selv når børn lærer sproget via ostensiv definition (det at pege på en ting og sige dets navn), så indebærer dette et sprogspil hvis regler skal mestres før selve tillæringen af et sprog kan begynde. Sprogspil er desuden unikke for hver sproginstans. Enhver samtale har for eksempel et helt unikt sæt regler som aldrig kommer igen. Det kan således undre at vi i det hele taget er i stand til at kommunikere, til trods for denne ekstreme kontekstualitet som vores sprogbrug er underlagt.

Årsagen hertil er, ifølge Wittgenstein, at vi alle har en medfødt kapacitet for sprogspil, og at vi alle deler det han kalder en ”fælles livsform”. Wittgenstein selv beskæftiger sig ikke meget med hvad denne medfødte kapacitet for sprogspil kommer af, men indenfor de sidste par år er der blandt andet gjort opdagelser indenfor neurobiologien der understøtter synspunktet. I den næste artikel i serien ser vi blandt andet nærmere på opdagelsen af de såkaldte ”spejlneuroner”, som peger på at vi som mennesker har en medfødt kapacitet for samarbejde og empati, samt at disse egenskaber lader til at være stærkt forbundne med vores sprog. Ydermere kan vores ensartede kroppe, fysiske miljø og kulturelle omstændigheder også betegnes som delelementer af det som udgør vores fælles livsform.

oppefra_og_ned

Wittgensteins lektie fortæller os, at vi bør undlade at tage udgangspunkt i sprogets mindste bestanddele som man gør i dag, og i stedet starte ved det øverste niveau af sproganalyse, ’world knowledge’, som så successivt kan definere hvorledes vi bedst håndterer de nedre niveauer af sproganalyse.

Wittgensteins lektie er en vigtig pointe. Hvis forskere indenfor de sprogteknologiske aspekter af kunstig intelligens skal tage ved lære af hans voldsomme revidering af sin egen sprogforståelse, så må vi først og fremmest forkaste alle afarter af den logiske atomisme som stadig nyder stor indflydelse i dag. I stedet for at fokusere på de nederste niveauer af sproganalyse må svaret ligge i at starte ved det øverste niveau og arbejde sig nedad – ikke omvendt.

Grunden til at tendensen til at starte med de nederste niveauer af sproganalyse i den grad har vundet fodfæste, er at dette hurtigt har kunnet give konkrete resultater via relativt simple, statistiske metoder. Det betyder dog ikke nødvendigvis at de indeholder potentiale for at kunne videreudvikles til at inkludere de højere niveauer. Faktisk har de sidste års forskning vist det modsatte. Fokus bør altså rettes mod det øverste sproganalyseniveau ”World Knowledge”, som er den viden sprogbrugere må have for at kunne kommunikere med hinanden. Samtidigt skal vores indgangsvinkel hertil være, at denne viden skal organiseres ud fra en forståelse af vores fælles livsform og måden hvorpå den konkret udmønter sig i sproget.

I den anden del af denne lille serie på tre artikler, vil vi se nærmere på hvordan dette rent praktisk kan lade sig gøre, og gå dybere ind i nogle af de mest centrale konsekvenser for fremtidens forskning indenfor den sprogteknologiske side af moderne kunstig intelligens.

 Erik David Johnson, cand.it
www.erk.dk

Læs også:

  1. Fra Wittgenstein til Ontology Engineering 2: Kropslighedstesen og den kognitive semantik George Lakoff er en fremtrædende figur indenfor kognitiv semantik, og betragtes af mange som faderen til kropslighedstesen. Udover sine analyser af politisk billedsprog, er han især også kendt for sit...
  2. Fra Wittgenstein til Ontology Engineering 3: Kognitive mønstre og neurale netværk I denne tredje og sidste artikel i en serie af tre ser vi nærmere på de menneskelige, kognitive mønstre som den anden artikel i serien viste, var ganske essentielle. Fokus...
Tagget med: , , , , ,

Skriv en kommentar