Automatisering: de toekomst van data science en machine learning?

Video: The Future of Data Science with Automated Machine Learning

Inhoud

Automatisering in de Con van informatietechnologie
Is automatisering de toekomst van machinaal leren?
Geen bugs, geen stress - Uw stapsgewijze handleiding voor het creëren van levensveranderende software zonder uw leven te vernietigen
Casestudy
Machine learning kan taken vervangen
Gevolgtrekking

Bron: Krulua / Dreamstime.com

Afhaal:

Machine learning is de mogelijkheid voor een systeem om zijn eigen programmering te wijzigen. Maar als een systeem dit kan, zijn mensen dan nog steeds nodig?

Machine learning was een van de grootste vorderingen in de geschiedenis van de computer en wordt nu verondersteld in staat te zijn een belangrijke rol te spelen op het gebied van big data en analyse. Big data-analyse is een enorme uitdaging vanuit het perspectief van bedrijven. Activiteiten zoals het inzichtelijk maken van grote hoeveelheden verschillende gegevensindelingen, gegevensvoorbereiding voor analyse en het filteren van overtollige gegevens kunnen veel bronnen vergen. Het inhuren van datawetenschappers en -specialisten is een dure propositie en valt niet binnen de mogelijkheden van elk bedrijf. Experts zijn van mening dat machine learning vele taken in verband met analyse kan automatiseren - zowel routineus als complex. Het automatiseren van machine learning kan veel bronnen vrijmaken die kunnen worden gebruikt in meer complexe en innovatieve taken. Het lijkt erop dat machine learning die kant op is gegaan. (Zie De beloften en valkuilen van machine learning voor meer informatie over het gebruik van machine learning.)

Automatisering in de Con van informatietechnologie

In de context van IT is automatisering het koppelen van ongelijksoortige systemen en software zodat ze specifieke taken kunnen uitvoeren zonder menselijke tussenkomst. In de IT-industrie kunnen geautomatiseerde systemen zowel eenvoudige als complexe taken uitvoeren. Een voorbeeld van een eenvoudige taak zou kunnen zijn om een formulier te integreren met een PDF en het document in te voeren bij de juiste ontvanger, terwijl het beschikbaar stellen van een offsite back-up een voorbeeld kan zijn van een complexe taak.

Om zijn werk te doen, moet een geautomatiseerd systeem worden geprogrammeerd of expliciete instructies worden gegeven. Telkens wanneer een geautomatiseerd systeem nodig is om de reikwijdte van zijn taken te wijzigen, moet het programma of de set instructies door een mens worden bijgewerkt. Hoewel geautomatiseerde systemen efficiënt werken, kunnen er om verschillende redenen fouten optreden. Wanneer er fouten optreden, moet de hoofdoorzaak worden geïdentificeerd en verholpen. Vanzelfsprekend zijn geautomatiseerde systemen voor hun werk volledig afhankelijk van mensen. Hoe complexer de aard van de taak, hoe groter de kans op fouten en problemen.

Gewoonlijk worden routinematige en herhaalbare taken toegewezen aan geautomatiseerde systemen. Een veelgebruikt voorbeeld van automatisering in de IT-industrie is het automatiseren van het testen van webgebaseerde gebruikersinterfaces. Testcases worden ingevoerd in automatiseringsscripts en de gebruikersinterfaces worden dienovereenkomstig getest. (Zie Machine Learning & Hadoop in Next-Generation Fraud Detection voor meer informatie over praktisch gebruik van machine learning.)

Het argument voor automatisering is dat het routinematige en herhaalbare taken uitvoert en werknemers meer complexe en creatieve taken laat uitvoeren. Er wordt echter ook beweerd dat automatisering veel banen of rollen heeft verplaatst die voorheen door mensen werden uitgevoerd. Nu machine learning zijn weg vindt naar verschillende industrieën, kan automatisering een nieuwe dimensie toevoegen.

Is automatisering de toekomst van machinaal leren?

De essentie van machine learning is het vermogen van systemen om continu van gegevens te leren en te evolueren zonder tussenkomst van mensen. Machine learning kan zich gedragen als het menselijk brein. Een aanbevelingsengine op een e-commerce-website kan bijvoorbeeld de unieke voorkeuren en smaken van een gebruiker beoordelen en aanbevelingen doen voor producten en diensten die het beste passen bij de keuzes van de gebruiker. Gezien deze mogelijkheid wordt machine learning als ideaal beschouwd voor het automatiseren van complexe taken met betrekking tot big data en analyse. Het heeft de belangrijkste beperking van de traditionele automatiseringssystemen die niet kunnen werken zonder regelmatige menselijke tussenkomst al overwonnen. Er zijn meerdere casestudies die aantonen dat machine learning in staat is geavanceerde gegevensanalysetaken uit te voeren, zoals later in dit artikel wordt besproken.

Zoals eerder aangegeven, is big data-analyse een uitdagende propositie voor bedrijven en kan het gedeeltelijk worden overgedragen aan machine learning-systemen. Vanuit het perspectief van een bedrijf kan dit veel voordelen opleveren, zoals het vrijmaken van gegevenswetenschappelijke middelen voor meer creatieve en kritieke opdrachten, een groter werkvolume, minder tijd om taken uit te voeren en kosteneffectiviteit.

Geen bugs, geen stress - Uw stapsgewijze handleiding voor het creëren van levensveranderende software zonder uw leven te vernietigen

U kunt uw programmeervaardigheden niet verbeteren als niemand om softwarekwaliteit geeft.

Casestudy

In 2015 begonnen MIT-onderzoekers te werken aan een data science-tool die in staat is om voorspellende datamodellen te maken uit enorme hoeveelheden onbewerkte gegevens met behulp van een techniek die het Deep Feature Synthesis-algoritme wordt genoemd. De wetenschappers beweren dat het algoritme de beste functies van machine learning kan combineren. Volgens de wetenschappers hebben ze het algoritme al getest op drie verschillende gegevenssets en gaan ze het testbereik uitbreiden naar meer gegevenssets. Onderzoekers James Max Kanter en Kalyan Veeramachaneni beschrijven hoe ze het doen in een artikel dat op een internationale conferentie voor data science en analytics wordt gepresenteerd: “Met behulp van een automatisch afstemmingsproces optimaliseren we het hele traject zonder menselijke betrokkenheid, waardoor het kan generaliseren naar verschillende datasets. ”

Laten we eens kijken hoe complex de taak is geweest: het algoritme heeft een functie die bekend staat als automatische afstemmingsfunctie, met behulp waarvan het inzichten of waarden ontleent of extraheert aan ruwe gegevens zoals leeftijd of geslacht, en daarna kan voorspellende datamodellen maken. Het algoritme maakt gebruik van complexe wiskundige functies en een waarschijnlijkheidstheorie die bekend staat als Gaussiaanse Copula. Het is dus gemakkelijk om de mate van complexiteit te begrijpen die het algoritme aankan. De techniek heeft ook prijzen gewonnen in competities.

Machine learning kan taken vervangen

Over de hele wereld wordt besproken dat machine learning veel banen zou kunnen vervangen omdat het taken uitvoert met de efficiëntie van een menselijk brein. Er is zelfs enige bezorgdheid dat machinaal leren gegevenswetenschappers zal vervangen - en er lijkt een basis te zijn voor dergelijke vrees.

Voor de gewone gebruikers die niet over de vaardigheden voor gegevensanalyse beschikken, maar in hun dagelijkse leven toch in verschillende mate analyses nodig hebben, is het niet haalbaar om computers te hebben die in staat zijn enorme datavolumes te analyseren en analyses aan te bieden. Maar technologieën voor natuurlijke taalverwerking (NLP) kunnen deze beperking overwinnen door computers te leren de natuurlijke, gesproken taal van mensen te accepteren en te verwerken. Op die manier heeft de gewone gebruiker geen geavanceerde analysemogelijkheden of vaardigheden nodig.

IBM is van mening dat de behoefte aan datawetenschappers kan worden geminimaliseerd of geëlimineerd met zijn product Watson-platform voor analyse van de natuurlijke taal. Volgens zijn vice-president voor Watson Analytics en Business Intelligence, Marc Atschuller: “Met een cognitief systeem zoals Watson stel je alleen je vraag - of als je geen vraag hebt, upload je gewoon je gegevens en kan Watson ernaar kijken en afleiden wat je misschien wilt weten. '

Gevolgtrekking

Automatisering is de volgende logische stap voor machine learning en we hebben de effecten in ons dagelijks leven al ervaren - in e-commerce websites, vriendensuggesties, LinkedIn-netwerkaanbevelingen en Airbnb-zoekranglijsten. Gezien de gegeven voorbeelden kan er geen twijfel over bestaan dat de kwaliteit van de output wordt geproduceerd door geautomatiseerde machine learning-systemen. Voor al zijn kwaliteiten en voordelen, lijkt de gedachte dat machine learning enorme werkloosheid veroorzaakt een beetje een overdreven reactie. Machines vervangen mensen al vele decennia in veel gebieden van ons leven en toch zijn mensen geëvolueerd en aangepast om relevant te blijven in de industrie. Afhankelijk van het perspectief is machine learning, ondanks al zijn disruptiviteit, gewoon weer zo'n golf waaraan mensen zich zullen aanpassen.