Google vertelt over het belang van open source en open data in een recente blogpost
Google heeft als bedrijf altijd open-source software en data gesteund, althans in hun standpunt. Het is nu bijna een trend bij grote bedrijven, aangezien zowel Google als Microsoft een prominente bijdrage hebben geleverd aan de open source-scene. "Google levert ook een belangrijke bijdrage aan open-source software. Belangrijke voorbeelden hiervan zijn Android, ons smartphone-besturingssysteem, Chromium, de codebasis voor onze Chrome-browser (nu ook voor veel concurrenten) en TensorFlow, ons machine learning-systeem. De release van Kubernetes door Google heeft cloudhosting voor altijd veranderd en heeft innovatie en concurrentie in de cloudindustrie mogelijk gemaakt. Google levert ook de grootste bijdrage van open source-code aan GitHub, een gedeelde opslagplaats voor softwareontwikkeling. In 2017 hebben Googlers alleen al op GitHub meer dan 250.000 wijzigingen aangebracht in tienduizenden projecten.”
In de meeste gevallen gaat het niet echt om vrijgevigheid, maar meer om te profiteren van gratis ontwikkeling en vervolgens om te profiteren van wijdverbreide acceptatie. Hoe dan ook, deze bijdragen hebben duizenden onderzoekers geholpen en hebben de ontwikkeling van software op een uniforme manier geleid, wat moet worden gevierd. Google benadrukte in een recente blogpost hun bijdrage aan open data en open-source software.
Met de komst van realtime tracking en de ontwikkeling van zelfrijdende auto's wordt er veel onderzoek gedaan naar computer vision en loopt Google als een van de bedrijven voorop in Visual Tech.
Google beschikt ook over veel gegevens die NLP-onderzoek kunnen helpen en computers kunnen helpen menselijke spraak beter te begrijpen. In de blogpost benadrukte Google het delen van een belangrijke database met de vermelding "Met betrekking tot taalverwerking hebben we de Natural Questions-database gedeeld, die 307.373 door mensen gegenereerde vragen en antwoorden bevat. We hebben ook het Triljoen Woord Corpus beschikbaar gesteld, dat is gebaseerd op woorden die op openbare webpagina's worden gebruikt, en de Ngram Viewer, die kan worden gebruikt om de meer dan 25 miljoen boeken in Google Boeken te verkennen. Deze collecties kunnen worden gebruikt voor statistische machinevertaling, spraakherkenning, spellingcorrectie, entiteitsdetectie, informatie-extractie en ander taalonderzoek. "
De zoekmachine is een van de kernactiviteiten van Google en ontvangt elke seconde meer dan 63.000 zoekopdrachten. Deze gegevens zijn erg belangrijk voor het bedrijf en Google analyseert deze gegevens voor gerichte advertenties. Toch worden enkele inzichten in de algemene gegevens openbaar gemaakt in de trendsportal van Google.
“Google biedt ook Google Trends, een gratis service waarmee iedereen sinds 2004 geaggregeerde zoekactiviteiten kan bekijken en downloaden voor Google Zoeken, Afbeeldingen zoeken, Nieuws zoeken, Winkelen en YouTube. U kunt maandelijks, wekelijks, dagelijks en zelfs elk uur zoekinformatie krijgen voor landen, regio's, grootstedelijke gebieden en steden. De Trends-gegevens worden veel gebruikt door onderzoekers op uiteenlopende gebieden als geneeskunde en economie. Volgens Google Scholar zijn er meer dan 21.000 onderzoeksdocumenten waarin Trends als gegevensbron worden genoemd. "
Waarom werken aan open source-projecten?
Ik heb hier kort over gesproken aan het begin van het artikel. Een nieuw stuk software kan een geweldig idee implementeren en de ruimte innoveren, maar dat weerhoudt anderen er niet van om soortgelijke ideeën te implementeren en vervolgens te werken om het te verbeteren. Veel bedrijven hebben het op de harde manier geleerd, bijvoorbeeld de Windows Phone. Zoals we weten was het een klinkende mislukking en om veel redenen, maar het hebben van een gesloten omgeving en het controleren van licenties was er een groot deel van. Hardoop en HDFS waren open-source versies van MapReduce die door Google werden gebouwd en het bedrijf leerde al vroeg het belang van open-source. Samenvattend is de beslissing om een IP open source te maken een strategische.
Google gaat in zijn blogpost in op een paar andere redenen en stelt: "Eerst en vooral is onze primaire missie "de informatie van de wereld te organiseren en universeel toegankelijk en bruikbaar te maken". Een voor de hand liggende manier om informatie universeel toegankelijk en bruikbaar te maken, is zeker om het weg te geven!”
Ze praten ook over waarom ze sommige dingen niet kunnen vrijgeven en zeggen: "Natuurlijk kunnen we niet alle gegevens vrijgeven die we in ons bedrijf gebruiken. We moeten de privacy van gebruikers beschermen, de vertrouwelijkheid voor zakelijke klanten handhaven en het eigen intellectuele eigendom van Google beschermen. Maar met inachtneming van dergelijke overwegingen, proberen we over het algemeen onze gegevens zo ‘universeel toegankelijk en bruikbaar’ te maken.“