Fra data-rod til AI-resultater: Sådan starter du rigtigt

af Janna Bundvad-Åmodt - Senior Engineer
| Læsetid: minutter

En nylig MIT-undersøgelse viste, at 95 procent af alle AI-projekter ikke giver noget som helst afkast, selvom der investeres milliarder af dollars. MIT Sloan, Gartner og NIST er alle enige om, at årsagen til fiasko kan spores ét sted hen: datakvaliteten!

Inden for det seneste årti er den forventede mængde af data, der genereres årligt, eksploderet, fra 15,5 zettabytes i 2015 til forventede 181 zettabytes i 2025. Hver dag skabes der omtrent 402,74 millioner terabytes data, og kurven ser ikke ud til at flade ud foreløbig.

Hvis data håndteres korrekt, bliver de en guldmine, der lader AI‑kanariefuglen synge. Men hvor en ægte kanariefugl ville signalere fare ved at blive stille, forholder det sig anderledes med en AI‑løsning. Den fortsætter med at synge, selv når noget er galt, og genererer svar, der er unøjagtige, biased eller rene hallucinationer. Det frustrerer slutbrugerne og fører ofte til manglende adoption.

Er jeres organisation dataklar?

Ufuldstændige, biased og forældede datasæt er blandt de største udfordringer, organisationer står over for i forbindelse med AI- og analytics-projekter. Ofte findes der flere datakilder uden én entydig single source of truth, og der er kun begrænset klarhed over, hvem der ejer hvilke data, og hvem der er ansvarlig for at holde dem opdaterede.

Statiske Excel-filer bliver sendt rundt som e-mailvedhæftninger, hvilket ofte ender i panik, når en bestemt version er nødvendig (“vent, jeg tror, jeg sendte den til Karen i sidste uge – lad mig lige finde den…”). Data er også ofte siloiseret, enten af nødvendighed eller som et resultat af intern politik, fx når afdeling A ikke vil dele data med afdeling B af frygt for misbrug.

  • Datavalidering er minimal eller helt fraværende, hvilket gør data sårbare over for menneskelige fejl og forskellige inkonsistenser. 
  • Stik ikke jeres AI‑kanariefugl direkte ned i denne mine. Den vil da stadig synge, men det bliver ikke kønt.

Så hvad kan du gøre?

Start i det små. Når du bygger et hus, begynder du ikke med at købe møblerne, du starter med at lægge et solidt fundament. Det samme gælder her, data er fundamentet og derfor bør du, som i ethvert andet IT‑projekt, starte med en pilot og starte småt.

Vælg et afgrænset domæne eller en afdeling, som kan gå forrest. Udvælg en håndfuld datakilder, som piloten skal fokusere på. Det er afgørende, at udvælgelsen holdes stram, for der opdages næsten altid nye behov under pilotfasen, som kræver, at yderligere datakilder tilføjes for at understøtte de eksisterende.

Fokuser på disse tre områder:

  • Data governance og datakvalitet
  • Data ingestion, databehandling og modellering
  • Skalerbarhed og fleksibilitet

Det sikrer, at data bliver renset og forberedt korrekt til de forretningsmæssige use cases, I skal levere på, og at I står stærkt, når platformen skal skaleres efter pilotfasen.

Forretningsmæssige AI use cases

Den sidste, afgørende brik i puslespillet er at sikre, at der findes validerede forretningsmæssige use cases, som løsningen skal levere på. Med andre ord: Hvem har brug for løsningen, og hvilke problemer skal den løse?

Det er vigtigt i alle IT-projekter, men særligt i AI‑projekter. Klare mål og tydeligt definerede use cases kan være forskellen mellem succes og fiasko. Sørg for at forstå både forretningens udfordringer og målgruppen, og sikr, at de får mulighed for at give input og dele deres erfaringer under kravindsamlingen. Det betyder også, at når du indsamler data til løsningen, kan du fokusere på at indlæse og klargøre de rigtige data fremfor at forsøge at medtage alt, hvad du kan finde på din vej.

Opsummering

Ligesom med big data, analytics og rapportering understreger AI endnu en gang behovet for at investere i en pålidelig dataplatform, der fungerer som én fælles single source of truth, før man dykker dybere ned i datadrevne projekter. En solid dataplatform med rene, pålidelige og velstrukturerede data er en forudsætning for at lykkes med AI‑projekter. Og når først dataplatformen er bygget, står din datamine klar, og så kan AI‑kanariefuglen endelig få lov at synge ordentligt.

Vil du styrke datagrundlaget, reducere kompleksitet og skabe AI‑løsninger, der faktisk gør en forskel? Så ræk ud til rasmus.halvor@soprasteria.com. Vi hjælper jer sikkert fra datakaos til dataklar.

 

Search