Kompetencer
Udviklingen af computerteknologi har gjort, at der i dag
eksisterer store mængder data i alle erhvervslivets brancher.
Denne data er værdifuld for hver enkelt virksomhed, hvis den
kan blive omsat til information der kan optimere markedsføring,
arbejdsprocesser eller produktprofilering. For at få
information ud af data, har man imidlertid brug for en række
dataanalyseredskaber, der kræver matematisk ekspertise –
en ekspertise, som er Epitals kernekompetence.
Denne side giver en introduktion til den type af dataanalyse der
er Epitals speciale og viser hvordan den kan tænkes
implementeret i en række forskellige sammenhænge.
Introduktion til machine learning
Machine learning er en del af matematisk dataanalyse, hvor man
lærer en computer at udføre en opgave ved hjælp af
data-eksempler fremfor specifikke regler. I fagområdet indgår
en betydelig mængde programmering som redskab, men fagområdet
som sådan handler ikke om programmering. Essensen er
udformningen af de matematiske modeller der skal indfange
informationen fra data.
Siden begyndelsen af firserne, har en bred vifte af fagområder
på universiteterne interesseret sig for ikke-lineære
metoder til at lade et computer program finde sammenhænge og
strukturer i data. En gruppe af de metoder der opnåede at blive
kendt i den almindelige befolkning er de neurale netværk.
Neurale netværk er simple modeller af hvordan hjernen menes at
fungere, og de resultater man med almindelige computere kunne opnå
allerede i midten af firserne, inspirerede både eksperter og
lægfolk til at spekulere i en eksotisk fremtid for kunstig
intelligens.
Men de neurale netværk er bare én blandt mange
forskellige metoder til analyse af data. De statistisk baserede
metoder, hvor data ofte antages at være stokastisk og derfor
bedst beskrevet via sandsynlighedsregning og statistik, har de
seneste ti år gennemgået en voldsom udvikling og er i dag
i udstrakt grad smeltet sammen med neurocomputing. En anden gren er
Kernel metoderne, der udspringer af ønsket om at kombinere
stabiliteten ved de lineære metoder, med fleksibiliteten ved de
ikke-lineære. Kernel metoder har vist sig at være et meget stærkt
instrument og er accepteret som et vigtigt redskab for praktikere.
I dag er der således en rig fauna af teknikker til
matematisk data analyse. Enkelte af dem har en kort levetid fordi de
ikke er tilstrækkeligt robuste og andre slår aldrig
igennem fordi de er for komplekse også - for forskningsmiljøet.
Men langsomt og sikkert forbedres de eksisterende teknikker samtidig
med at nye udvikles, og det er som stedkendt stifinder i dette
landskab af muligheder, at Epital servicerer sine kunder. Epital
hjælper kunderne ved at udvælge og bruge de rette metoder
til netop deres problem og er på den måde bindeleddet
mellem forskningsfronten og de kommercielle anvendelser af machine
learning.
Eksempler
Den udvikling der har været indenfor machine learning er
ikke bare interessant i sig selv, men har også gjort det muligt
at anvende machine learning på en række praktiske
problemer. Herunder er eksempler på hvordan man verden over har
løst konkrete udfordringer med machine learning.
Eksempel
1: I de fleste produktionsanlæg er der motorer til at drive
roboter, samlebånd eller sorteringsmekanismer. Det er motorer
der ofte er kritiske for produktion eller sikkerhed, og
vedligeholdelse og reparation af sådanne maskiner kan være
meget kostbar. Derfor er det vigtigt at vide hvornår det er tid
til at skifte eller justere dele af motoren så man hverken
foretager vedligeholdelsen unødvendigt ofte - eller endnu
værre - for sent. Men ved at lytte til motoren med
ultralydsmikrofoner og analysere signalet med machine learning, kan
man finde begyndende fejl før et almindeligt menneske kan
registrere en forskel og længe før motoren bryder
sammen. Det svarer til at man kan høre på sin
almindelige personbil hvis der er noget galt, og at dygtige
mekanikere kan lytte sig frem til hvad fejlen er. Med
motormonitorering er denne teknik forfinet, så fejl opdages
inden de bliver et problem.
Eksempel
2: I landbrugsproduktion spiller kvalitetskontrol en vigtig
rolle. Ved effektivt at skelne en type af fødevarer fra en
anden, kan producenter sælge produkter i en niche uden at
skulle bruge store manuelle resourcer på at kontrollere at have
opfyldt gældende krav fra myndigheder og forbrugere. Dette
gælder ikke mindst i kaffeindustrien, hvor machine learning har
været brugt til at skelne økologisk kaffe fra
traditionelt dyrket kaffe. Processen foregår ved en såkaldt
INAA måling af kaffeprøven der fortæller hvor
meget af blandt andre stofferne Br, Ca, Cs, Co, Mn, og Rb der er i
prøven. Derefter analyseres og klassificeres denne data med
machine learning og resultatet er at man automatisk kan skelne
økologisk fra traditionel kaffe.
Generelle opgaver
Som man kan se i eksemplerne ovenfor, er der mange forskellige
problemer man kan vælge at løse med machine learning. De
fleste af dem falder imidlertid på den ene eller anden måde
i en række generelle kategorier: klassifikation, regression,
separation og prediktion.
Klassifikation. At klassificere på baggrund af data,
er en meget bred og anvendelig opgave. Det betyder kort fortalt at
inddele sine datamålinger i grupper efter en eller anden
information. Det kan være majskolber der ønskes inddelt
efter kvalitet, lydoptagelser der ønskes inddelt efter om
optagelsen er foretaget ude eller inde, eller modermærker der
ønskes inddelt efter hvilken risiko de udgør for
patienten.
Regression. Regression er de opgaver hvor man gerne vil
finde en funktionssammenhæng mellem to eller flere størrelser.
Det kan være man vil bestemme alkoholmængden af en væske
ud fra en spectralprøve eller forventede telefonopkald i timen ud fra
salg den foregående dag. Regression favner en meget generelt
anvendelig gruppe af teknikker der ofte tjener som hjælpemidler
i andre typer af opgaver som f.eks. klassifikation.
Separation. Det er i mange sammenhænge sådan, at
de signaler man er interesserede i er blandet sammen med andre
signaler. I de situationer, er målingerne altså en
blanding af ønskede og uønskede signaler, og for at
skille dem ad har man brug for en såkaldt separationsteknik.
Signalseparation kan foretages på mange måder, men
medmindre man har viden om hvordan signalerne blev blandet, har man
brug for teknikker der kan udføre blind signalseparation, dvs
skille signaler ad med et minimum af antagelser om både
signalerne og den måde der er blevet blandet på.
Prediktion. At forudsige hvad der vil komme om et kort
øjeblik er indlysende en vigtigt opgave i mange forskellige
sammenhænge. Det kræver at det data der foreligger rent
faktisk har evnen til at gøre det, dvs indeholder information
om fremtiden, men det kræver også at den model man træner
til at foretage forudsigelsen passer med dynamikken i datasættet.
Teknikkerne
Det er ikke et fast sæt af teknikker der udgør
hverken machine learning eller dataanalyse mere generelt. Der bliver
i forskningsverden konstant udviklet nye metoder og det er vigtigt at
følge med for altid at kunne vælge den bedste løsning.
Men der er etablerede teknikker der har eksisteret i mange år
takket være deres kvalitet og gavnlighed for mange grene af
videnskaben og erhvervslivet. Disse etablerede teknikker er også
en del Epitals redskaber og kan anvendes såvel alene som i
kombination med hinanden. I alfabetisk rækkefølge er
nogle af disse:
Bayesian networks, Canonical Correlation Analysis, Gaussian
Mixture Modelling, Gaussian Processes, Hidden Markov Models,
Independent Component Analysis (ICA), Kalman Filters, Kernel methods,
Kmeans, K-Nearest Neighbours, Mean Field, Monte Carlo, Neurale
netværk, Nonnegative Matrix Factorization (NMF), Partial Least
Squares (PLS), Principal Component Analysis (PCA), State Space
models, Wavelet transformationer.
Det er disse teknikker, sammen med en generel viden om hvordan man
træner dem ved hjælp af dataeksempler, der er Epitals
særlige ekspertise. Machine learning bragt sammen med
traditionel signalbehandling og erfaringer med den data man arbejder
med, udgør et meget stærkt redskab til at løse
vanskelige problemer - problemer så vanskelige som kun den
virkelige verden kan lave dem.
© Copyright 2013 Epital ApS
|