DJ Patil, l’actuel Chef scientifique des données des États-Unis et précédemment responsable des produits de données chez Linkedin, est celui qui a inventé le premier le terme « science des données ».
DJ estime que « le trait dominant chez les scientifiques des données est une curiosité intense, un désir d’aller sous la surface d’un problème, de trouver les questions qui en sont au cœur et de les distiller en un ensemble très clair d’hypothèses qui peuvent être testées. » Il n’est pas question ici d’une définition stricte de la science des données, ni d’un profil qui doit y correspondre.
Doug Cutting, l’un des ingénieurs de données les plus célèbres au monde et le créateur du cadre Hadoop, qui a contribué à propulser la science des données dans le courant dominant, a obtenu un baccalauréat en linguistique. Tim O’Reilly, aujourd’hui connu comme le fondateur de O’Reilly Media, et le conservateur de milliers de données et de ressources de programmation, a obtenu un diplôme en lettres classiques.
Le trait le plus important chez les scientifiques des données ne sont pas les diplômes techniques, ou le temps passé à l’école. C’est la curiosité qui les attire vers des problèmes difficiles et qui tire des solutions et de nouvelles perspectives de vieux ensembles de données.
Vous pouvez vous lancer dans la science des données à partir d’une formation non technique et faire la même chose. Springboard a récemment construit un parcours de carrière en science des données pour vous aider à le faire. Voici quelques conseils pratiques de leur part.
1. Montez en compétences avec un Curriculum organisé !
L’une des meilleures choses qu’un diplôme en science des données vous donnerait serait un programme d’études structuré avec beaucoup de retours et de pratique sous la forme d’examens et de devoirs. La structure est particulièrement importante étant donné l’ampleur de la science des données. La recherche des ressources dont vous avez besoin pour réussir prendrait beaucoup de temps, surtout si vous ne savez pas du tout par où commencer. Springboard propose un parcours d’apprentissage curé qui peut servir de programme d’études.
2. Faites des projets réels
Une fois que vous avez fini d’apprendre les différentes compétences et outils, il n’y a rien de mieux que de s’exercer sur des situations réelles. Bien souvent, la meilleure façon de compenser le manque de connaissances techniques démontrées qu’apporte un diplôme est la création de projets réels qui ont un impact. Un portefeuille de vos projets peut contribuer à vous faire remarquer et à renforcer vos références en tant que scientifique des données en herbe. Vous apprendrez également à appliquer vos compétences et à les améliorer à un rythme beaucoup plus rapide. Vous voudrez vous attaquer à un problème de fond et voir si vous pouvez trouver une solution basée sur des informations cachées dans des quantités de données. Est-il possible de prédire les résultats électoraux à partir des tendances de la participation ? Est-il possible de retracer les performances d’un joueur de basket-ball grâce à des tweets le montrant en train de faire la fête la veille ? Le monde est votre toile ici : vous pouvez prendre n’importe quel ensemble de données et lui apporter une nouvelle perspective grâce à vos nouvelles compétences. Si vous ne trouvez pas d’ensemble de données, consultez cette liste de 19 ensembles de données publics gratuits ou utilisez un moteur de recherche d’ensembles de données tel que Quandl. Si vous ne trouvez rien à faire, des plateformes comme Kaggle, Datakind et Datadriven vous permettent de travailler sur des problèmes réels d’entreprise ou de société. En utilisant vos compétences en science des données, vous pouvez montrer votre capacité à faire la différence et créer l’actif de portefeuille le plus solide de tous : un parti-pris démontré pour l’action.
3. Rejoignez les communautés de science des données
Inévitablement, vous allez vouloir vous ramifier et rechercher des communautés de science des données pour obtenir les dernières nouvelles et discuter des problèmes que vous pourriez rencontrer. Vous commencerez également à voir comment les scientifiques des données interagissent entre eux. Si vous souhaitez obtenir le meilleur et le plus récent contenu sur la science des données, vous pouvez consulter KDNuggets ou Datatau. Datatau est un agrégateur de contenu de science des données où les gens peuvent voter pour la meilleure sélection de contenu de science des données. Vous pouvez également suivre des scientifiques sur Twitter et écouter différents podcasts sur la science des données. Nous avons une liste des meilleurs comptes et podcasts à suivre.
4. Assistez à des événements de science des données
Pour vraiment vous immerger dans la communauté de la science des données, vous devrez assister à des événements physiques. Heureusement, il y en a beaucoup : des conférences à grande échelle aux rencontres plus petites. Les trois plus grandes conférences sont la Strata Conference, le KDD (Knowledge Discovery in Data Science) et le NIPS (Neural Information Processing Systems). Elles rassemblent généralement des centaines, voire des milliers de professionnels du secteur et proposent souvent des tutoriels techniques et des conférences qui vous permettront d’acquérir une nouvelle perspective de la science des données. Strata a tendance à être orienté vers les dernières tendances de l’industrie, des startups passionnantes aux géants établis. KDD est plus axé sur la théorie et les connaissances de la science des données, et NIPS est plus axé sur les avancées universitaires dans ce domaine. Vous n’êtes pas obligé de vous rendre à ces conférences pour avoir un aperçu de ce qui se passe lorsque vous interagissez en personne avec les communautés de la science des données. Vous pouvez participer à des rencontres de science des données plus modestes qui ont lieu dans le monde entier. La région de la baie de San Francisco a tendance à accueillir le plus grand nombre de réunions sur les données, mais il y en a généralement une dans chaque grande ville américaine. Vous pouvez rechercher les réunions sur la science des données près de chez vous sur Meetup.com. Certains des plus grands meetups de science des données, avec plus de 4 000 membres, sont SF Data Mining, Data Science DC, Data Science London et le Bay Area R User Group.
5. Obtenez un mentor dans le domaine
Il peut être difficile de naviguer dans la science des données, surtout si vous venez d’un milieu non-technique. Vous n’aurez pas accès aux réseaux qui parcourent la Silicon Valley en fonction du diplôme. Une fois que vous sentez que vous êtes sur une base solide, il est plus important que jamais que vous vous mettiez en relation avec quelqu’un qui est dans le secteur afin qu’il puisse vous donner un retour sur ce que vous devez améliorer et, surtout, un contact interne et une référence lorsque vous en avez besoin. Une grande partie de l’embauche dans le domaine de la science des données, comme dans tout autre domaine, nécessite souvent un réseautage. La plupart des emplois ne sont pas affichés ouvertement, ils sont discutés au sein de réseaux de contacts. Assurez-vous d’être impliqué dans la communauté et d’avoir quelqu’un qui se bat pour vous. Cela peut faire la différence entre essayer de trouver un emploi et travailler votre premier jour en tant que scientifique des données. Vous pouvez également utiliser une solution telle que le parcours de carrière en science des données avec mentorat de Springboard pour faire progresser votre carrière en science des données.
6. Préparez-vous à l’entretien
Si vous venez d’un milieu non-technique, un entretien en science des données peut être particulièrement intimidant, car il enveloppe les questions d’ingénierie logicielle de statistiques et de mathématiques. Pour avoir un aperçu de ce qui vous attend, consultez le manuel d’entretien en science des données, qui contient 120 exemples de questions. L’entretien en science des données est une bête très étrange. On vous demandera ce que vous savez sur l’entreprise et le secteur, ainsi que sur vos expériences passées, comme dans tout entretien classique. Vous serez également interrogé sur vos compétences en ingénierie des données et, à bien des égards, certains aspects de l’entretien ressembleront à des entretiens d’ingénierie logicielle, avec un peu de statistiques et de théorie de la science des données. Assurez-vous d’être préparé à tout ce qui pourrait survenir.
7. Ne cessez jamais d’apprendre
Pour perfectionner chaque compétence que la science des données requiert, il faudrait passer plusieurs vies sur le sujet. Vous n’aurez jamais fini d’apprendre, et vous devriez toujours garder l’esprit de curiosité intellectuelle qui vous a amené à la science des données en premier lieu.
Paul Kalanithi, un chirurgien de Stanford qui a dû faire face à une mortalité précoce, a écrit de façon poétique sa vision de la vie dans ses mémoires, When Breath Becomes Air : « On ne peut jamais atteindre la perfection, mais on peut croire en une asymptote vers laquelle on tend sans cesse. »
Vous devrez adopter cette mentalité si vous voulez vous lancer dans la science des données et poursuivre votre carrière. Peut-être qu’un jour, vous deviendrez vous-même un mentor, enseignant au fur et à mesure que vous apprenez, et complétant le cycle de la science des données !