Forsiden

Kompetencer
Kurser
Kunder

Publikationer
Om Epital
Stillinger
Kontakt

Kompetencer

Udviklingen af computerteknologi har gjort, at der i dag eksisterer store mængder data i alle erhvervslivets brancher. Denne data er værdifuld for hver enkelt virksomhed, hvis den kan blive omsat til information der kan optimere markedsføring, arbejdsprocesser eller produktprofilering. For at få information ud af data, har man imidlertid brug for en række dataanalyseredskaber, der kræver matematisk ekspertise – en ekspertise, som er Epitals kernekompetence.

Denne side giver en introduktion til den type af dataanalyse der er Epitals speciale og viser hvordan den kan tænkes implementeret i en række forskellige sammenhænge.

Introduktion til machine learning

Machine learning er en del af matematisk dataanalyse, hvor man lærer en computer at udføre en opgave ved hjælp af data-eksempler fremfor specifikke regler. I fagområdet indgår en betydelig mængde programmering som redskab, men fagområdet som sådan handler ikke om programmering. Essensen er udformningen af de matematiske modeller der skal indfange informationen fra data.

Siden begyndelsen af firserne, har en bred vifte af fagområder på universiteterne interesseret sig for ikke-lineære metoder til at lade et computer program finde sammenhænge og strukturer i data. En gruppe af de metoder der opnåede at blive kendt i den almindelige befolkning er de neurale netværk. Neurale netværk er simple modeller af hvordan hjernen menes at fungere, og de resultater man med almindelige computere kunne opnå allerede i midten af firserne, inspirerede både eksperter og lægfolk til at spekulere i en eksotisk fremtid for kunstig intelligens.

Men de neurale netværk er bare én blandt mange forskellige metoder til analyse af data. De statistisk baserede metoder, hvor data ofte antages at være stokastisk og derfor bedst beskrevet via sandsynlighedsregning og statistik, har de seneste ti år gennemgået en voldsom udvikling og er i dag i udstrakt grad smeltet sammen med neurocomputing. En anden gren er Kernel metoderne, der udspringer af ønsket om at kombinere stabiliteten ved de lineære metoder, med fleksibiliteten ved de ikke-lineære. Kernel metoder har vist sig at være et meget stærkt instrument og er accepteret som et vigtigt redskab for praktikere.

I dag er der således en rig fauna af teknikker til matematisk data analyse. Enkelte af dem har en kort levetid fordi de ikke er tilstrækkeligt robuste og andre slår aldrig igennem fordi de er for komplekse også - for forskningsmiljøet. Men langsomt og sikkert forbedres de eksisterende teknikker samtidig med at nye udvikles, og det er som stedkendt stifinder i dette landskab af muligheder, at Epital servicerer sine kunder. Epital hjælper kunderne ved at udvælge og bruge de rette metoder til netop deres problem og er på den måde bindeleddet mellem forskningsfronten og de kommercielle anvendelser af machine learning.

Eksempler

Den udvikling der har været indenfor machine learning er ikke bare interessant i sig selv, men har også gjort det muligt at anvende machine learning på en række praktiske problemer. Herunder er eksempler på hvordan man verden over har løst konkrete udfordringer med machine learning.

Eksempel 1: I de fleste produktionsanlæg er der motorer til at drive roboter, samlebånd eller sorteringsmekanismer. Det er motorer der ofte er kritiske for produktion eller sikkerhed, og vedligeholdelse og reparation af sådanne maskiner kan være meget kostbar. Derfor er det vigtigt at vide hvornår det er tid til at skifte eller justere dele af motoren så man hverken foretager vedligeholdelsen unødvendigt ofte - eller endnu værre - for sent. Men ved at lytte til motoren med ultralydsmikrofoner og analysere signalet med machine learning, kan man finde begyndende fejl før et almindeligt menneske kan registrere en forskel og længe før motoren bryder sammen. Det svarer til at man kan høre på sin almindelige personbil hvis der er noget galt, og at dygtige mekanikere kan lytte sig frem til hvad fejlen er. Med motormonitorering er denne teknik forfinet, så fejl opdages inden de bliver et problem.

Eksempel 2: I landbrugsproduktion spiller kvalitetskontrol en vigtig rolle. Ved effektivt at skelne en type af fødevarer fra en anden, kan producenter sælge produkter i en niche uden at skulle bruge store manuelle resourcer på at kontrollere at have opfyldt gældende krav fra myndigheder og forbrugere. Dette gælder ikke mindst i kaffeindustrien, hvor machine learning har været brugt til at skelne økologisk kaffe fra traditionelt dyrket kaffe. Processen foregår ved en såkaldt INAA måling af kaffeprøven der fortæller hvor meget af blandt andre stofferne Br, Ca, Cs, Co, Mn, og Rb der er i prøven. Derefter analyseres og klassificeres denne data med machine learning og resultatet er at man automatisk kan skelne økologisk fra traditionel kaffe.

Generelle opgaver

Som man kan se i eksemplerne ovenfor, er der mange forskellige problemer man kan vælge at løse med machine learning. De fleste af dem falder imidlertid på den ene eller anden måde i en række generelle kategorier: klassifikation, regression, separation og prediktion.

Klassifikation. At klassificere på baggrund af data, er en meget bred og anvendelig opgave. Det betyder kort fortalt at inddele sine datamålinger i grupper efter en eller anden information. Det kan være majskolber der ønskes inddelt efter kvalitet, lydoptagelser der ønskes inddelt efter om optagelsen er foretaget ude eller inde, eller modermærker der ønskes inddelt efter hvilken risiko de udgør for patienten.

Regression. Regression er de opgaver hvor man gerne vil finde en funktionssammenhæng mellem to eller flere størrelser. Det kan være man vil bestemme alkoholmængden af en væske ud fra en spectralprøve eller forventede telefonopkald i timen ud fra salg den foregående dag. Regression favner en meget generelt anvendelig gruppe af teknikker der ofte tjener som hjælpemidler i andre typer af opgaver som f.eks. klassifikation.

Separation. Det er i mange sammenhænge sådan, at de signaler man er interesserede i er blandet sammen med andre signaler. I de situationer, er målingerne altså en blanding af ønskede og uønskede signaler, og for at skille dem ad har man brug for en såkaldt separationsteknik. Signalseparation kan foretages på mange måder, men medmindre man har viden om hvordan signalerne blev blandet, har man brug for teknikker der kan udføre blind signalseparation, dvs skille signaler ad med et minimum af antagelser om både signalerne og den måde der er blevet blandet på.

Prediktion. At forudsige hvad der vil komme om et kort øjeblik er indlysende en vigtigt opgave i mange forskellige sammenhænge. Det kræver at det data der foreligger rent faktisk har evnen til at gøre det, dvs indeholder information om fremtiden, men det kræver også at den model man træner til at foretage forudsigelsen passer med dynamikken i datasættet.

Teknikkerne

Det er ikke et fast sæt af teknikker der udgør hverken machine learning eller dataanalyse mere generelt. Der bliver i forskningsverden konstant udviklet nye metoder og det er vigtigt at følge med for altid at kunne vælge den bedste løsning. Men der er etablerede teknikker der har eksisteret i mange år takket være deres kvalitet og gavnlighed for mange grene af videnskaben og erhvervslivet. Disse etablerede teknikker er også en del Epitals redskaber og kan anvendes såvel alene som i kombination med hinanden. I alfabetisk rækkefølge er nogle af disse:

Bayesian networks, Canonical Correlation Analysis, Gaussian Mixture Modelling, Gaussian Processes, Hidden Markov Models, Independent Component Analysis (ICA), Kalman Filters, Kernel methods, Kmeans, K-Nearest Neighbours, Mean Field, Monte Carlo, Neurale netværk, Nonnegative Matrix Factorization (NMF), Partial Least Squares (PLS), Principal Component Analysis (PCA), State Space models, Wavelet transformationer.

Det er disse teknikker, sammen med en generel viden om hvordan man træner dem ved hjælp af dataeksempler, der er Epitals særlige ekspertise. Machine learning bragt sammen med traditionel signalbehandling og erfaringer med den data man arbejder med, udgør et meget stærkt redskab til at løse vanskelige problemer - problemer så vanskelige som kun den virkelige verden kan lave dem.

© Copyright 2013 Epital ApS