Forum général.général [Métiers] Data ?

0
28
mar.
2016

Pas certain que c'est bien dans cette partie du forum qu'il faut poser cette question, donc désolé d'avance si je suis hors sujet.

En fait, j'aimerais savoir si, pour vous, un intégrateur(applicatif sur un ETL, ou exploitation) peut envisager(entamer une reconversion?) de prendre le chemin de la data, et notamment le poste très prisé qu'est le data-scientiste.

Franchement, je me suis documenté sur les pré-requis demandés, et ca fait fuir au premier abord, mais ça m'a l'air d'être un métier très intéressant, aussi bien pour les autres(la société,les gens) que pour soi-même(on considère que ce que l'on fait est valorisant, et reconnu).

Par contre, se replonger dans les cours pour acquérir un haut niveau en mathématique, et les statistiques, à plus de 30 ans, c'est pas simple, c'est même assez compliqué surtout lorsqu'on a un gros bagage dans la technique (et encore plus si on a fait que principalement du ksh).

Est-ce que ça vaut le coup, aussi bien métier que la reconversion ? Les recruteurs ne vont-ils pas s’orienter plutôt vers un profil plus chercheur que sur un intégrateur, même si ce dernier peut justifier via des formations? Vous verriez plus un autre type de poste, toujours dans la data ? Si c'est une perte de temps alors que ce profil peut l'utiliser pour acquérir des connaissances plus dans sa branche, vous proposeriez quoi ?

Merci pour la lecture, et éventuellement une réponse.

  • # Si ça t'intéresse, fait toi plaisir

    Posté par (page perso) . Évalué à 1.

    Si ton but c'est de gagner du fric, essaye plutôt de t'orienter vers la filière technico-comerciale, ça ira plus vite. Si par contre, c'est par intérêt pour le domaine (faire des maths appliquées), et que tu veux te rémunérer par satisfaction personnelle dès le début : tu peux par exemple commencer sous la forme d'un hobby, genre tu suis des MOOC au lieu de regarder Hanouna le soir. Tu prends des données sur l'open data ou par scrapping et tu y cherches des modèles et tu les partages sur un blog, twitter, stats.stackoverflow…

    Et puis, rien ne t'empêche de te lancer dans une thèse à 30 ans :)

    • [^] # Re: Si ça t'intéresse, fait toi plaisir

      Posté par . Évalué à 1.

      Justement, est-ce un intérêt pour le domaine des maths(puisque je parle de se remettre à fond dans les cours, ce qui signifie que l'intérêt n'est arrivé qu’après avoir eu écho que les métiers autour de la data sont recherchés, surtout plus que le métier d'intégrateur) ?

      Un passif dans l'intégration système et applicatif, et un désir d'aller vers les métiers de la data, est-ce que c'est compatible, et compréhensif par un recruteur ?

      • [^] # Re: Si ça t'intéresse, fait toi plaisir

        Posté par . Évalué à 3.

        Un passif dans l'intégration système et applicatif, et un désir d'aller vers les métiers de la data, est-ce que c'est compatible, et compréhensif par un recruteur ?

        y a que les abrutis qui ne changent pas d'avis et qui font le meme metier entre leur etude et la retraite.
        changer de boites, changer de postes pour voir ce qu'il y a autour, voire carrement se reorienter, je ne vois pas le probleme

        tant que tu es motivé, que tu prouves tes competences.
        evidemment faudra pas s'attendre à etre payer comme un senior dans le domaine, mais tes competences annexes pourront aider un peu sur cet aspect là.

    • [^] # Re: Si ça t'intéresse, fait toi plaisir

      Posté par . Évalué à 1. Dernière modification le 29/03/16 à 16:20.

      Et puis, rien ne t'empêche de te lancer dans une thèse à 30 ans :)

      Avant ça, j'espère, s'il écrit des journaux/tuto pour nous transmettre son savoir en même temps qu'il l'acquière, il pourra compter sur mon humble lecture pour chacun de ses articles ! :) (je kifferais en apprendre plus sur ce domaine hélas surtout documenté en anglais :) )

      Donation Bitcoin : 1N8QGrhJGWdZNQNSspm3rSGjtXaXv9Ngat

      • [^] # Re: Si ça t'intéresse, fait toi plaisir

        Posté par . Évalué à 1.

        C'est un peu l'idée. Avoir des retours/critiques positifs ou négatifs sur ce qui pourrait paraitre pertinent à partager, comme actuellement les projets qui tournent autour de sparkR (ou comment porter ce langage sur des clusters, et profiter de la parallélisation et de la puissance de calcul).

        Encore faut-il que je me mette à ce métier (et que potentiellement, je laisse de côté celui de la technique), ou ce qui pourrait s'en approcher, car de nos jours, il est rare de confirmer que l'on travaille pour le plaisir. Même pour un chercheur, ce serait difficile de vivre uniquement de ses travaux.

  • # Aurtograf

    Posté par . Évalué à 2. Dernière modification le 28/03/16 à 14:31.

    envisager(entamer une reconversion?) de prendre le chemin de la data, et notamment le poste très prisé qu'est le data-scientiste

    Tu devrais commencer par l’écrire correctement… C’est un terme anglais : "data scientist" (donc il n’y a ni e final ni trait d’union).

    En français Wikipédia emploi le terme de « scientifique des données ». On pourrait peut-être aussi le traduire par « statisticien des données » ou simplement « statisticien ».

    • [^] # Re: Aurtograf

      Posté par . Évalué à 1.

      merci, mais en fait, je connais bien l'orthographe: c'est juste que je voulais essayer de faire une phrase dans un français correct plutôt qu'utiliser de l'anglais à tout va, comme on le voit souvent lorsque l'on parle de ce métier.

      désolé si cela a paru être une méconnaissance du terme.

  • # profil

    Posté par (page perso) . Évalué à 2. Dernière modification le 28/03/16 à 16:10.

    Les recruteurs ne vont-ils pas s’orienter plutôt vers un profil plus chercheur que sur un intégrateur, même si ce dernier peut justifier via des formations?

    Effectivement, data scientist est plutôt un boulot de MOA et de statisticien. Pour autant, comme le dit NeoX< ci-dessus et vu que tu es prêt à suivre des formations, d'autant que tu as déjà bossé sur un ETL : bon, mettre en avant ta compréhension des modèles de données aiderait, mais déjà tu peux afficher la maîtrise des grosses volumétries et l'optimisation des traitements ; si tu as déjà travaillé avec les développeurs des transformations de données, les DBA au niveau des choix de modèles de données et sur une connaissance du fonctionnel, ce sera un plus.
    Si le terme de data-drilling (fouille de données) te parle, que tu as un côté artistique pour la visualisation de données (tout n'est pas qu'histogramme…), que tu as déjà joué avec R-project/aime bien le python, tu pourras approfondir ces sujets :-)

    Vous verriez plus un autre type de poste, toujours dans la data ?

    bin, le volet intégrateur :-) (je comprends que pour toi c'est situé entre les dévs et l'exploitant). Il y a déjà pas mal de choses à faire au niveau cassandra, hadoop (et tout son écosystème) et autres. Il y a moins l'aspect fonctionnel et le traitement de la données en elle-même et plus la maîtrise des perfs, l'optimisation des traitements…
    L'avantage, c'est que tu pourrais avoir la chance d'être pris sur un projet et voir si le domaine te convient effectivement. Vu que c'est très vaste la big data (et un peu galvaudé, il faut bien dire), cela te permettra peut-être d'être plus au clair de ce qui t'intéresse et des capacités effectivement nécessaires.

    • [^] # Re: profil

      Posté par . Évalué à 1.

      Merci BAud pour ton retour.

      En fait, quand je dis que j'ai bossé sur un ETL, c'est uniquement du côté intégration, pas la partie développement, et donc j'ai pas vu en gros les méthodes d'extraction, les modèles de sortie, etc.
      J'ai déjà bossé dans un environnement avec de grosses volumétrie, mais les requêtes simplistes que j'utilisais face à celles des DBA ne vont pas faire valoir mon expérience dans la donnée.

      Le data-drilling ne me parle pas, je me suis formé récemment sur R, et python, mais franchement j'ai pas d'avis sur le fait si je suis susceptible d'apprécier ce métier.

      J'ai un bagage technique, et je pense que ca se ressent. Je pourrais éventuellement débuter dans l'écosystème hadoop, et c'était une piste que j'envisageais au début, mais je ressent que ce métier ne risque pas d'être très demandé en France comparé à celui de data scientist, et on dirais que c'est moins valorisant que ce dernier.

      Je me trompe peut-être du fait que j'ai pas assez de recul en la matière.

      • [^] # Re: profil

        Posté par . Évalué à 1.

        après, il y a aussi le fait que c'est assez complexe comme métier: ca demande des connaissances très poussées en maths, algo, statistiques, et programmation.

        Sans compter le fait qu'il y a plein de prétendants (cv sur internet, site comme kaggle), mais que la demande ne se satisfait pas, on dirait. Les sociétés rechercheraient-elles un profil pointu ? Difficile de rentrer alors dans cette catégorie, je pense.

        En tout cas, pas sur que juste la motivation ça suffit.

  • # C'est un métier assez vague

    Posté par (page perso) . Évalué à 2.

    Data-scientist, suivant l'entreprise, ça peut vouloir dire beaucoup de choses.

    Tu as des entreprises ou c'est très "analyste", tu écris assez peu de code ou du moins peu de code de production et pour le coup le niveau en stats demandé va être assez poussé (surtout à l'entretien je pense, après dans la vraie vie ça reste assez basique sauf cas particuliers).

    Tu as des entreprises ou c'est très "recherche", tu écris des poc et tu files l'implémentation à une équipe de dev. La il vaut mieux avoir un profile recherche pour pouvoir s'enfiler des articles pointus (ça pique), coder rapidement qqch et l'expliquer un peu aux devs.

    Tu as des entreprises ou c'est très "développeur orienté machine learning". Là un bon niveau de développement, infra, bref savoir comment ça marche en dessous est un gros plus et ton parcours peut s'y vendre bien. Tu as moins besoin de comprendre précisément les maths en dessous mais de bien connaître ta boîte à outils d'algorithmes et d'être assez à l'aise dessus pour les intégrer, en proposer d'autres par dessus…

    Dans les autres métiers, tu as "data engineer" qui est un peu à cheval et ressemble à ce que tu as fait. Ca va être à toi de travailler sur les données de l'entreprise, mettre un ETL propre, faire des jobs batchs/hadoop… Tu es souvent un peu plus loin du machine learning, y a beaucoup de 'plomberie' mais ça peut aussi être une étape, genre "je fais data engineer pour commencer mais vous m'orientez ML au fur et à mesure".

    Les recruteurs peuvent être ouverts à des profils originaux, mais en général de ce que j'ai vu c'est un peu dans l'autre sens. Des non informaticiens traitant déjà beaucoup de données qui deviennent informaticien (par exemple des chimistes, des physiciens, des économistes…)

    • [^] # Re: C'est un métier assez vague

      Posté par . Évalué à 1.

      C'est effectivement le ressenti que j'ai constaté, et ce en parcourant différents témoignages de data scientist, et des descriptions de postes sur les sites.

      Autant tu peux travailler dans une petite structure où tu as la possibilité de tout mettre en pratique, et de porter de multiples casquettes (là aussi c'est pointu), autant tu peux travailler dans une grosse structure, avec une équipe dispatchée selon les tâches (un développeur, un matheux,etc.)

      Et le fait d'entrer par la "petite porte", du style data engineer pour espérer bifurquer vers un poste plus orienté recherche, ne garanti en rien que la boite va laisser faire. Pour diverses raisons, mais on peut signaler l'arrivée d'un nouveau, plus confirmé que toi (qui était resté dans la technique).

      J'ai aussi l'impression que les stats seraient pas nécessairement ce qui m'intéresse dans ce domaine, mais plutôt le fait de travailler la data, et de chercher ce qu'on peut faire avec. Le machine learning est ce qui semble s'en rapprocher, mais faire des algos qui au bout d'un moment peuvent aller dans le sens d'un modèle facilement exploitable par lambda, pas certain que ta plus value soit conservé.

      Mais dans tous les cas, on dirait bien que les recruteurs font plus confiance à un pur théoricien (maths, physique, etc.) qu'à un profil avec passif technique. Donc si c'est pour se lancer dans une branche de métier qui va plus fermer des portes qu'en ouvrir, notamment dans mon cas, alors non merci. Ce serait une perte de temps, je pense.

  • # Retour d'expérience

    Posté par . Évalué à 3.

    Le sujet tombe à pic car je viens d'être embaucher en tant que data scientist.

    Je viens d'une filière purement scientifique. J'ai toujours aimé programmé pour le plaisir, mais ça fait 2 ans que je me suis pris de passion pour les données. Voici donc mon expérience sur le sujet.

    La formation

    Comme cela a été dit, data scientist regroupe beaucoup de métiers différents qui n'ont parfois rien à voir entre eux : il y a des spécialistes de big data, de data mining, de machine learning, de data viz, …
    Mais il faut bien commencer quelque part. Pour ça, comme cela a été dit, l'apprentissage via des MOOC a plusieurs avantages : des cours structurés, des exercices, une certaine liberté de temps et un document qu'on peut afficher sur un CV. De plus pour commencer, la plupart des MOOC sur le sujet sont assez généraux pour permettre d'aborder plusieurs thèmes (comment lire des données, les nettoyer, les traiter, construire des modèles, …), ce qui permet de voir ce qui plait dans l'analyse de donnée. Il y a plein de plateformes différentes sur lesquelles je suis mes cours, certaines étantes payantes, d'autres non :

    • edX (pour l'apprentissage des stats, je recommande le cours "PH525.1x Statistics and R for the Life Sciences" où j'ai enfin compris d'où sortais cette p-value, oui je reviens de loin en stats)
    • datacamp
    • coursera
    • udacity
    La pratique

    Les exercices que j'ai pu faire en suivant des cours en ligne ne m'ont certainement pas suffit pour maîtriser les outils que j'ai pu apprendre. J'ai donc participé à des concours en ligne sur l'analyse de donnée et en particulier kaggle qui est très connu dans le milieu. Mon conseil la dessus est de te créer un compte si ce n'est pas déjà fait et de faire les premiers problèmes proposés qui possèdent des tutos. Tu vas pouvoir ensuite améliorer tes programmes au fur et à mesure et participer à des challenges un peu plus compliqués.
    Kaggle permet aussi de voir le code des autres participant. Et même si ce n'est pas facile au début, lire le code de quelqu'un d'autre et essayer de le comprendre font également parti de l'apprentissage (du moins de mon point de vue).

    Il existe d'autre plateformes qui proposent des exercices :
    - topcoder pour les data-science
    - codingame pour l'algorithmie
    - project euler pour algorithmie et maths

    Un autre exercice qui peu plaire à un recruteur c'est de se faire un projet personnel. Ouvre un compte sur https://www.data.gouv.fr/fr/, récupère des données qui te tiennent à cœur et analyse les. Publie ensuite les résultats dans un journal ici, sur github, ton site perso, ou tout autre plateforme qu'un recruteur pourra consulter.
    Par exemple, un projet que j'ai fait quand j'ai commencé, a consisté à récupérer les données des vélos en libre service de la ville de Seattle (parce que j'y ai passé un peu de temps) et essayer de prédire si à une date et une heure donnée, un vélo sera disponible à une certaine station.

    La recherche d'emploi

    D'après mon expérience, oublie les filières de recrutement classique car oui il y a des offres mais c'est là aussi où il y a le plus de réponses aux offres. Personnellement j'ai été recruté via un forum, parce que ça a été l'occasion pour moi d'avoir un recruteur directement un face à face et de montrer que mon projet professionnel tenait la route.
    J'ai eu plusieurs pistes par angel.co qui regroupent pas mal d'offres dans ce domaine (à l'étranger notamment).

    Il sera aussi plus dur d'intégrer une grosse boîte. J'ai eu un entretien pour travailler chez Veolia et j'ai eu une réponse assez franche : dans les grosses boîtes, les profils recherchés sont généralement très spécifiques et ils vont donc chercher des candidats avec un profil ciblé (des écoles de stats, des personnes avec de l'expérience dans un certain domaine).
    En revanche, les PME recherchent des personnes qui vont savoir être polyvalentes, et savoir où chercher l'information, ce que tu auras appris à faire en apprenant sur le tas.

    En tout cas je te souhaite bon courage, En étant déterminé il n'y a pas de raison pour que tu n'arrives pas à tes fins.

    • [^] # Re: Retour d'expérience

      Posté par . Évalué à 1.

      Merci pour ton retour détaillé, bien que je sois déjà au courant d'une partie de ce que tu rapportes.
      Mais je serais pas contre de communiquer avec toi sur le sujet vu que tu es en plein dedans.

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.