Orm på sensoren Hvad sker der, når IoT-data er dårlige?

Virksomheder, der forsøger at bruge tingene på internettet, står allerede overfor en strøm af data og et svimlende udvalg af måder at analysere det på. Men hvad sker der, hvis oplysningerne er forkerte?

Dårlige data er almindelige i IoT, og selvom det er svært at få et skøn over, hvor meget information, der streamer ind fra tilsluttede enheder ikke kan bruges, tænker mange mennesker på problemet.

Cirka 40 procent af alle data fra kanterne af IoT-netværk er "svage", siger Harel Kodesh, vicepræsident for GE's Predix-softwarevirksomhed og CTO for GE Digital. Meget af disse data er ikke forkerte, bare ubrugelig: duplikatoplysninger, som medarbejdere ved et uheld uploadede to gange, eller gentagne meddelelser, som tomgangsmaskiner sender automatisk. 

Derudover kan opbygning af en ny IoT-platform oven på gamle industrielle rapporteringssystemer forårsage problemer, fordi de ældre værktøjer formaterer data på deres egen måde, sagde Kodesh. "Du tager ikke de rigtige elementære data, du tager en oversættelse af det."

Men nogle gange genererer enheder bare ting, der er falske eller vildledende.

Måling af den forkerte ting

For eksempel, hvis en orm gennemsøger en temperatur- og fugtighedsføler i et felt, får landmanden en læsning af, hvor varm og fugtig ormen er, hvilket ikke hjælper med at drive en gård. Hvis en sensor bliver dækket af snavs eller fabriksskum, eller hvis den er beskadiget af vandaler, kan det også justere de data, den producerer.

Jo hårdere de omgivende forhold, og jo mere isoleret enheden er, desto dårligere er problemet med dårlige data sandsynligvis. Ud over landbrug står industrier som olie og gas og energifordeling over for dette. Men det er ikke kun fjerntliggende sensorer, der har problemer. Selv på et hospital kan en blod-iltføler, der er klemt på en patients finger, begynde at give dårlige data, hvis den bliver stukket i den forkerte position.

Derudover fungerer nogle IoT-enheder på egen hånd og begynder at sprøjte dårlige data ud eller stoppe med at rapportere overhovedet. I mange andre tilfælde er menneskelig fejl den skyldige: De forkerte indstillinger ødelægger, hvad enheden genererer.

En måde at skære ned på dårlige data på er at sikre, at gearet er indstillet korrekt.

John Deere udstyrer sine gigantiske landbrugsværktøjer med sensorer, der registrerer, om maskinerne fungerer rigtigt. Virksomhedens ExactEmerge-planter, der ruller bag en traktor, der planter frø over et felt, har tre sensorer pr. Række afgrøder for at registrere, hvor mange frø der plantes, og i hvilken hastighed. Mindst en gang om året, inden plantetid, kalder landmanden eller en Deere-forhandler manuelt disse sensorer, så de er nøjagtige, sagde Lane Arthur, Deeres direktør for digitale løsninger.

Mere er bedre

Men mange IoT-sensorer er for svære at nå til regelmæssig kalibrering og vedligeholdelse. I disse tilfælde kan overflødighed være svaret, skønt det ikke er en sølvkugle.

Duplikater af den samme sensor på en maskine, i en mine eller i et felt genererer flere input, hvilket kan være nyttigt i sig selv. Weather Underground, som er en del af IBM's Weather Company-forretning, opretter sine rapporter delvis med data fra ukalibrerede, lavprissensorer i forbrugernes baghave. For ikke meget penge giver de Weather Underground flere datapunkter, men kvalitet er et stort problem. Én sensor kan fungere og rapportere flere centimeter regn, mens den der ved siden af ​​mærker ingen, sagde John Cohn, IBM-stipendiaten for Watson IoT.

"Det fantastiske er, hvis du har tilstrækkelig massefylde af denne slags sensorer, kan du… matematisk finde outliers og grunden til, at man kræver arbejde," sagde Cohn.

Virksomheder kan også bruge forskellige sensorenheder, især kameraer, til at tjekke sensorer, der kan have problemer. Et videokamera kombineret med billedanalysesoftware kan registrere, om en fjernenhed er blevet snavset, beskadiget eller vandaliseret, sagde Doug Bellin, senior manager for globale private sektorer i Cisco Systems. Nogle gange kan sikkerhedskameraer, der allerede er der for noget andet, udføre dette job.

En teknik til at verificere forskellige slags sensorer mod hinanden kaldes sensorfusion. Det vejer input fra to eller flere sensorer for at komme til en konklusion.

Sensorfusion implementeres nu på hospitaler, hvor falske alarmer er udbredt, sagde Stan Schneider, præsident og administrerende direktør for IoT-softwarevirksomheden Real-Time Innovations (RTI). For eksempel snarere end at slå en alarm af, hver gang blodsyrer-sensoren på en patients finger viste lavt ilt, ville et sensorsfusionssystem konstant sammenligne denne læsning med dem fra andre sensorer på patienten, som respirations- og pulsmåler.

Fantomsensoren

Andre kilder kan også stå i en sensor, der ikke engang er der længere. GE tester hver jetmotor, der kommer ud af sine fabrikker for udstødningstemperatur, et tal, der afspejler dens effektivitet, sagde Kodesh. GE sætter en sensor lige i udstødningsstien, selvom den altid brænder op efter få minutter. I mellemtiden indsamler sensorer på sikrere steder omkring motoren data på samme tid, og ved at sammenligne deres aflæsninger med det, den dødsdømte enhed blev optaget før den blev ødelagt, kan GE genskabe den direkte sensor som en virtuel - en matematisk funktion.

At drage konklusioner fra flere informationsstrømme bringer datakvalitetsproblemet ind i området for maskinlæring. Det er her de mest interessante ting sker, siger IBMs Cohn.

For eksempel bruger IBM sin Watson-analyseplatform til at forstå energiforbrug på IBM-faciliteter i Irland. Ikke kun kan Watson markere et uoverensstemmelse, hvis et klimaanlæg siger, at det er slukket, men den samlede strømtiltrækning er for høj til, at det er sandt, men over tid kan det lære at identificere den særlige måde, hvorpå det klimaanlæg trækker strøm, når det kommer på. Med denne viden kan et system, der siger, at det ikke er tændt, blive fanget med røde hænder.

Som en kontrol af defekte data tager maskinlæring tid at komme op i hastighed i modsætning til tilføjede sensorer eller kameraer.

”Det bliver smartere, jo mere det løber. Første gang det kører, ville jeg ikke stole på det, ”sagde Ciscos Bellin. ”Den tusinde gang, det kører, er det ... sandsynligvis smartere end jeg er.”

Jo mere kritisk IoT-systemet er, desto vigtigere er det at håndtere dårlige data. Sensorfusion, for eksempel, er nødvendig for ting som patientsundhed og missildetektion, fordi pålidelighed er et stort problem, når indsatsen er så høj, sagde RTIs Schneider.

Men nogle former for IoT kan sandsynligvis klare sig uden den flere datakilder, sagde han. ”Det har du ikke brug for i termostaten i dit hus.”

Deltag i Network World-samfundene på Facebook og LinkedIn for at kommentere emner, der er øverste af sindet.