Machine Learning kan bruges til at bygge... Machine Learning

Automatiseret afprøvning af 'best fit'-algoritmer kan accelerere udviklingen af Machine Learning og Artificial Intelligence, så AI hurtigere kan udvikles til operationel AI. Et af de konkrete resultater er et teknologisk spring fra Natural Language Processing til Natural Language Understanding

Teknologier som Artificial Intelligence (AI) og Machine Learning (ML) åbner døren for et væld af nye, datadrevede løsninger. Men det kan være en udfordring, at få AI- og ML-løsningerne ind i en operationel kontekst, hvor prædiktive algoritmer passer til de konkrete problemstillinger, man ønsker at løse.

Her kan AI/ML bruges til at bygge AI/ML-løsninger hurtigere og mere effektivt, så udviklere, data scientists og andre specialister bliver mere produktive og på kortere tid leverer forudsigelige resultater til forretningen. Kort sagt: Kunstig intelligens kan bruges til at bygge kunstig intelligens.

Lyn-evaluering af 'best fit' algoritme

I CGI er vi i gang med at afprøve nye muligheder for at automatisere dele af udviklingsprocessen - med gode resultater. Vi er i fuld gang med at hæve niveauet for fremtidens løsninger i form af operationel AI, som vi implementerer i konkrete kundeløsninger.

Arbejdet udspringer blandt andet af en intern innovationskonkurrence blandt CGIs members (medarbejdere), og af en test af et nyt værktøj til accelereret Machine Learning: DataRobot (som jeg i al fairness skal huske at nævne er en af vores partnere.)

DataRobot er et rammeværk, som automatiserer afprøvningen af algoritmer på den konkrete dataproblemstilling med hjælp fra et bibliotek af registrerede algoritmer. Algoritmerne bliver evalueret ud fra deres egnethed til problemstillingen, hvorefter en scoring finder den algoritme som er 'best fit.'

Resultater på få minutter

Resultaterne kommer i løbet af få minutter - en opgave, som ellers ville have taget dage. Antallet af iterationer bliver forøget markant gennem en ”fail fast” tilgang til at udfordre de væsentlige datafeatures. Derved kan konklusioner drages inden for få timer/dage i stedet for uger. Herefter kan den prædiktive algoritme indlejres i en operationel kontekst som fx web eller mobilapp via API eller generet kode (python/java.)

Algoritmerne kan kombineres - tænk LEGO-klodser - og biblioteket kan udvides med egne algoritmer for at dokumentere, vedligeholde og optimere effektiviteten og nøjagtigheden yderligere. Det er et oplagt rammeværk til Machine Learning i organisationer med mange data for mange forskellige problemstillinger.

Når det er sagt, er det vigtigt at huske på, at den automatiserede afprøvning i sig selv ikke kan give resultater, som mennesker ikke kunne have nået frem til. Men resultaterne kommer langt hurtigere, for i data science gælder 80/20-reglen også:

En tommelfingeregel siger, at 80 procent af arbejdet i udvikling af AI/ML går med data preparation (feature engineering). Så det siger sig selv, at accelereret afprøvning kan afkorte udviklingstiden markant og give kortere time-to-market på nye løsninger, der skaber værdi.

Operationel AI i konkret løsning til sundhedssektoren

Helt konkret er vores egen, interne innovationskonkurrence meget hurtigt blevet modnet til et konkret kundeprojekt. Resultatet er, at vi i et kommende modul til CGIs patologisystem hæver niveauet for operationel AI.

CGI arbejder på at foretage et teknologisk spring fra Natural Language Processing (NLP) til Natural Language Understanding (NLU), hvilket vil gøre stor forskel for landets patologer i deres livsvigtige arbejde med at analysere data fra patientprøver.

CGIs systemer i dag understøtter allerede NLP ved dansk talegenkendelse indbygget i løsningen, så patologen ikke længere skriver, men indtaler, sine observationer mens prøverne håndtereres eller undersøges i mikroskop. Observationen fremgår som transskriberet tekst i patologisystemet.

Ved hjælp af Machine Learning kan vi sammenligne datagrundlaget fra tidligere observationer og de efterfølgende diagnosekoder og opstille en model for de mest sandsynlige diagnoser.

Dette løfter os til en forståelse og tolkning af data i en specifik kontekst, her patologi, som er Natural Language Understanding (NLU).

NLU assisterer patologerne med forslag til de mest sandsynlige diagnosekoder og giver patologen et forbedret datagrundlag til at stille de mest sandsynlige diagnoser mere effektivt, mere sikkert og med færre fejl. Alt sammen til gavn for den enkelte patient og samfundet som helhed.

Set i et bredere perspektiv tror jeg, at vores erfaringer giver et fingerpeg om, hvor udviklingen inden for AI/ML er på vej hen: Vi vil se markant øget brug af automation i udviklingsfasen, hvor kunstig intelligens bygger kunstig intelligens. Vi vil også se, at AI bliver mere operationel i takt med, at udviklere på kortere tid kan bygge og afprøve endnu mere avancerede løsninger, som går et (eller mange) skridt videre end hvad vi hidtil har set.

CGI artikel i DATATECH (Teknologiens Mediehus - Viden for professionelle)

Thomas Herlin, Data Innovation Director, CGI