Introduktion till Machine Learning (Maskininlärning)
För flera decennier sedan började man skapa matematiska funktioner som fungerar som generella inlärningsprocedurer. I detta sammanhang innebär inlärningsprocedur helt enkelt en procedur som möjliggör för datorn att lära sig mönster i data. Generell innebär att proceduren kan användas i många olika sammanhang, exempelvis för att analysera besökare på en webbsida, studera cancerpatienter, utvärdera aktier på börsen eller väderleken den kommande veckan. Dessa metoder går under benämningen maskininlärning (eng. machine learning), vilket indikerar att det är en dator (maskinen) som lär sig.
Principen för machine learning (maskininlärning)
Principen för machine learning är enkel. Datorn lär sig genom att hitta mönster i data och utifrån detta skapas regler. Dessa regler kan sedan användas för att bedöma nya data, som algoritmen ännu inte sett. För att illustrera detta tar vi ett exempel med elever i gymnasieskolan. Föreställ dig att vi har data på 1000 elever. Data inkluderar elevens kön, föräldrarnas inkomst, elevens närvaro i skolan, provresultat första året och slutbetyg sista året (Tabell 1). Vi kan använda machine learning för att studera hur kön, föräldrars inkomst, närvaro och provresultat första året påverkar slutbetyg sista året. Maskinen kommer studera eleverna för att hitta mönster som avslöjar vilka faktorer som påverkar slutbetyg och hur de påverkar slutbetyg. Troligtvis kommer datorn upptäcka att elever med hög närvaro och bra provresultat första året också kommer ha höga slutbetyg sista året. Dessa upptäckter görs om till regler som sedan kan användas för att förutsäga hur nya elever kommer prestera i skolan. Reglerna kan alltså användas för att förutsäga nya elevers slutbetyg redan efter första året.
TABELL 1 | Kön | Föräldrars inkomst | Skolnärvaro | Tentaresultat år 1 | Slutbetyg |
---|---|---|---|---|---|
Martin | Man | 670000 | 75 % | C | C |
Johanna | Kvinna | 950000 | 69 % | B | B |
Mohammed | Man | 531000 | 83 % | A | A |
Luciano | Man | 370000 | 100 % | C | B |
För att förstå maskininlärning använder vi ytterligare ett exempel. Föreställ dig att vi driver en webbutik där vi säljer kläder. Vår målsättning är att så många besökare som möjligt skall köpa kläder. Tyvärr är det vanligt att besökarna inte fullföljer sina köp (de lämnar webbutiken innan köpet slutförts). Vi kan använda maskininlärning för att beräkna sannolikheten för att en besökare kommer lämna butiken innan köpet fullföljts. Vi vill nämligen visa en rabattkod för besökare som vi beräknar har hög sannolikhet för att avbryta köpet. Syftet med att ge dem en rabattkod är att öka deras benägenhet att fullfölja köpet. Utmaningen står i att ge rabattkupongen till rätt besökare (vi vill inte dela ut rabattkuponger till besökare som ändå kommer genomföra ett köp). För att lösa uppgiften har vi exempeldata från våra tidigare besökare. För varje besökare har vi uppgift om dennes ålder, kön, adress, tidigare inköp, tid på dygnet, datum, produkter som lagts i kundkorgen, sidor den besökt, hur långt tid den spenderat på varje sida och så vidare. Vi vet också om besökaren genomförde köpet eller lämnade butiken. Vi kan använda maskininlärning för att hitta mönster som särskiljer personer som genomför köp från de som inte genomför köp. Den generella inlärningsproceduren kommer hitta dessa mönster och utifrån dessa skapas regler. Dessa regler utgör således en algoritm som sedan kan användas på nya besökare för att beräkna hur stor sannolikheten är för att de skall lämna sidan innan köp genomförts. Vi kan använda dessa sannolikheter för att avgöra vilka besökare som skall få en rabattkod och förhoppningsvis fullfölja sitt köp.
I båda ovanstående exempel använder datorn en generell inlärningsprocedur för att hitta mönster i data. Dessa mönster används för att skapa regler. Eftersom reglerna skapas utifrån mönster i data så säger man att metoden är datadriven (eng. datadriven methods).
Att predicera (förutsäga) för att överleva
En prediktion är en förutsägelse. Att kunna förutsäga framtiden är extremt åtråvärt. Föreställ dig att du hade kunnat förutsäga vilka aktier som kommer stiga i värde eller vilka sjukdomar du kommer att drabbas av under livets gång. Under de senaste åren har alla verksamheter (företag, forskare, organisationer, regeringar osv) blivit allt mer intresserade av att kunna predicera. Faktum är att hela verksamhetens överlevnad kan vara avhängig av att man kan predicera och gör det med hög precision.
Eftersom nästan allt går att predicera så har prediktionsanalys intagit en central ställning i alla verksamheter. För en biltillverkare är det rimligt att exempelvis predicera hur många bilar den förväntas sälja nästa år (detta påverkar produktionsplanering), prisutveckling på bensin/diesel/el (detta påverkar hur motorerna skall konstrueras), risken för att priset på råvaror och komponenter skall stiga (detta påverkar prissättningen av bilarna) och så vidare. Alla verksamheter måste idag lära sig predicera.
Det är följande tre faktorer som föranlett det stora intresset för prediktionsanalys:
- De flesta verksamheter samlar in stora mängder data, vilket utgör underlaget för all prediktion. Detta är anledningen till att man idag säger att data är värdefullt.
- Mjukvara och hårdvara för prediktionsanalys finns tillgänglig för alla.
- Förmåga att analysera data har spridit sig i samhället. För 10 år sedan var det nästan enbart matematiker och statistiker som analyserade data. Idag kan vem som helst lära sig analysera data.
Att kunna förutsäga framtiden är maskininlärningens huvuduppgift. Maskininlärning används alltså för att predicera. I tidigare exempel använde vi maskininlärning för att predicera skolelevers slutbetyg. Det finns andra metoder, utöver machine learning, för att predicera men på senare år har det visat sig att precisionen i prediktionerna är som regel högst med machine learning, oavsett vilken typ av data man analyserar.