Épisode 3 : Données sensibles et signaux faibles
Transcription :
(La transcription de cet épisode automatiquement. Il peut y avoir des erreurs. N’hésitez pas à nous en faire par dans les commentaires.)
— Marc — 00:00 :
Cette semaine, je reçois Adrien Fenech. Il est ingénieur dépita, président et cofondateur d’estimeo au depuis plus de 6 ans, il enseigna Epita, Epitech dauphine. Il est également formateur en cybersécurité et il a rejoint l’an dernier le classement Forbes thirty under forty, Bonjour Adrien, Bonjour Marc. Alors, Adrien, est-ce que tu peux nous parler d’estimeo? Qu’est-ce que vous faites exactement?
— Adrien — 1:30 :
Bien sûr, donc estiméo. C’est l’agence de notation et de valorisation des start-up en France et en Angleterre. De faire simple, nous accompagnons les entrepreneurs dans justement cette démarche d’analyse et on va aider également tout l’écosystème à bien situer justement les startups. Donc on va être très utile, notamment pour les investisseurs qui souhaitent justement investir dans les projets pour les banques qui sont friands, un peu de rapport de notation. Les incubateurs accélérateurs qui souhaitent justement analyser leur start-up en début et en fin de promotion et bien entendu les grands comptes qui vont être là plutôt pour s’associer avec des start-ups et voir si elles sont encore en vie. Au bout de 6 mois. Au-delà de ça, nous ont aussi tout l’accompagnement qu’il y a autour, donc notamment les entraînements au pitch, la revue des documents, des mises en situation notamment avec des investisseurs et des mises en relation avec des investisseurs.
– Marc — 02:04 :
D’accord, donc vos clients sont tous ceux qui sont intéressés par l’écosystème? Comprendre mieux l’écosystème des startups et puis la start-up elle-même qui veulent se faire accompagner.
– Adrien — 02:13 :
Bien entendu.
– Marc — 02:14 :
Alors la data, chez estimeo. À quoi, à qui ça sert, comment vous gérez?
– Adrien — 02:19 :
Alors, la data, elle est avant tout utile justement pour nos analystes justement, pour comprendre à la fois bien entendu les startups pour correctement les analyser. Mais au-delà de ça, pour créer un contexte autour des entrepreneurs et des entreprises directement ces données, hein? On a l’habitude de dire que c’est le nerf de la guerre, un petit peu dans les entreprises et notamment du numérique. Et Ben ici c’est réellement le cas puisque c’est ce qui va servir justement à notre moteur pour pouvoir analyser un petit peu. Les entreprises, les valoriser. Il faut savoir qu’en France ou en Angleterre et en règle générale dans le monde du capital risque, la valorisation d’entreprise, c’est avant tout financier. Ici, on parle de jeunes entreprises, les fameuses Harley stage donc qui vont lever leurs premiers fonds, hein, du du précis de la série à et que généralement ces entreprises n’ont pas 36 bilans financiers derrière, donc on va ici analyser plutôt l’humain, le marché et la technique, l’offre, le produit un peu. Tous ces critères extra financiers qui sont durs à quantifier mais qui sont très qualitatifs et donc nous on va justement utiliser. Un peu cette donnée derrière réussir à la quantifier, à la transformer pour à la fois la faire tourner dans nos moteurs d’algorithmes et à la fois aussi pour aider nos analystes à bien comprendre et à bien analyser les entreprises.
– Marc — 03:29 :
D’accord alors pour rentrer dans le vif du sujet, est-ce que tu peux nous parler d’une décision business ou 2 décisions business en général que vous prenez grâce à la data?
– Adrien — 03:38 :
Alors, quand un investisseur souhaite investir dans un projet issu, généralement ce qu’on appelle une thèse d’investissement, donc à savoir par exemple quelles vont être les montants investis qu’elle va être également le secteur visé et potentiellement d’autres critères? Comme ça et Ben nous la donner en fait qu’on a derrière, on va l’avoir. Cette donnée sur les start-up et on va pouvoir mettre en relation les bonnes start-up avec les bons investisseurs et que ça soit vraiment ce duo un peu win-win que l’on cherche lors d’un investissement. Au-delà de ça, nous nos analyses, on essaie de les rendre les plus qualifiés possibles, les plus qualitatifs possibles et pour ça, la donnée que ça soit extra financier où financier, comme je le disais, est critiqué le le principe même de l’investissement et d’investir sur ce qu’on appelle les signaux faibles et ces signaux faibles. On va justement réussir à les trouver dans cette masse de données. Donc imaginez un questionnaire de plusieurs centaines de questions ou les entrepreneurs vont prendre le temps d’y répondre. Et bah le but du jeu va être de trouver un petit peu cette aiguille dans la botte de foin.
– Marc — 04:33 :
Si tu dois décrire le plus simplement possible, on va dire la l’architecture technique de la data, comment vous la stocker, comment vous la récupérez, comment vous la consommez alors sur ce coup là, je vais être obligé de de parler de 2 phases distinctes qu’il y a eu chez timéo, tout d’abord, pour récolter cette donnée, il faut bien comprendre que comme je le disais avant, on parle d’un gros formulaire, ce formulaire, bien entendu, on n’a pas essayé tout de suite de le développer, de le coder, de le mettre dans une base de données, et cetera, pour être sûr de pas se planter sur notre méthodologie d’analyse. Au tout début, il y a 6 ans. Avec mon associé, on avait créé un énorme Excel d’une d’une centaine de lignes pareille en en nombre de colonnes et le but était de remplir main dans la main avec l’entrepreneur. Toutes les données, ces données qui étaient mine de rien, un peu en vrac à l’époque. Alors bien entendu, orienter, cibler, mais tout de même un peu décousu, un peu flou. Et c’est grâce justement à cette phase sur Excel donc cette première architecture, un peu cette véro qui était sur Excel, qu’on a pu un peu trier tout ça et créer justement ce qui allait être par la suite. La vraie architecture qu’on a actuellement et la rendre la plus pertinente possible. Donc cette première phase de cette première architecture Excel qu’on avait était un peu brouillon mais nécessaire. Et grâce à ça, on a pu passer sur une architecture beaucoup plus structurée donc à savoir une belle architecture technique avec du docker, plusieurs langages, plusieurs services, une belle base de données en en mongodb, ça c’est une partie pris parce que j’ai du mal avec SQL mais au-delà de ça, cette base de donnée structurée, nous a permis derrière de pouvoir travailler sur ces données là, toutes nos données sont référencées, bien entendues par entreprises et non pas par utilisateur. D’ailleurs, par rapport à ça, on est quasiment pas soumis à à RGPD justement parce qu’on a très peu finalement de données utilisateurs. On a des données qui sont cependant très critique puisque ce sont des données d’entreprise, c’est souvent des données que si demain elles devaient fuiter, causerait du tort à la fois bien entendu à estimer où mais aussi aux entreprises que nous, que nous analysons. Mais ces données, justement, sont correctement structurées dans une base de données.
– Marc — 06:39 :
On peut bien entendu les sortir sous format Excel si besoin justement pour les analystes, il faut bien comprendre que nos analyses ne sont pas des personnes techniques, donc les envoyer dans une architecture technique c’est compliqué. Donc on a réussi à créer des ponts un petit.
– Adrien — 06:52 :
Peu, bien entendu via Excel et via d’autres interfaces pour pouvoir justement utiliser ces données non seulement via nos algorithmes, donc très techniques, mais également pour nos analystes.
– Marc — 07:01 :
Eux qui ne le sont pas, c’est intéressant, c’est pont dont tu parles pour récupérer cette donnée qui est stockée dans votre base de données et qu’elle soit exploitable par vos analystes. Comment vous vous y prenez? Tu tu parlais un peu de d’envoyer sur Excel, mais alors bien sûr, alors le l’Excel est très pratique pour plusieurs raisons. Déjà, nous analyse, le comprennent parfaitement bien même les profils qui ne sont pas forcément analystes techniques comprennent qu’on a tous eu l’habitude de l’utiliser depuis des années et aussi c’est un format de partage qui est relativement simple avec les grands comptes, les investisseurs. Bref, c’est un moyen un peu unique de communiquer là-dessus. Au-delà de ça, nous, nos analyses ou en tout cas nos analyses algorithmie et toute la tech qu’on a derrière chez siméo. Permettent surtout aux analyses de gagner du temps. Nos analyses sont là pour utiliser leur matière grise et non pas pour simplement faire des stats, utiliser une calculatrice où écrire un rapport. Et en fait, c’est là que nous la tech va jouer un rôle majeur derrière, au-delà de de l’algorithme qui va se passer derrière pour analyser, sortir des contrôles de cohérence, mettre une note sur une entreprise ou en tout cas des premiers avis, on va gagner du temps sur bah les bonnes analyses à sortir, celles qui sont pertinentes, qu’on peut mettre en avant à la fois auprès de la start-up, des investisseurs et en fait toutes les parties prenantes. Du monde de la start-up et derrière, Ben utiliser un peu la matière grise de nos analystes sur des choses qui sont difficilement automatisables ou en tout cas qu’on ne peut pas encore les les mettre en place.
– Marc — 08:22 :
Ok alors ma question suivante était, est-ce que vous faites du machine learning? Mais donc de ce que je comprends de ce que je comprends, vous avez effectivement des algorithmes, est-ce que tu peux nous parler un petit peu de de vos usagés de machine learning?
– Adrien — 08:34 :
Alors c’est intéressant parce que le machine learning, en effet, on y a pensé, on en a même fait passer un moment. Alors non, pas sur l’analyse d’entreprise à proprement parler, je reviendrai après pourquoi mais plutôt sur la mise en relation automatique entre les start-up et les investisseurs. Comme je le disais tout à l’heure, il y a certes des tests d’investissement. Qu’il faut respecter mais au-delà de ça, ce sont les signaux faibles que nous recherchons et les signaux faibles sont très compliqués à trouver d’un point de vue humain et encore plus bien entendu automatiquement et donc c’est là où on s’est dit, bah tiens, autant tester la machine, voir ce qu’elle est capable de nous sortir de manière un peu improbable.
– Marc — 09:12 :
Et voir si c’est si ça marche ou pas, alors c’est un projet qu’on a mis en place il y a quelques années qui a duré pendant un an et demi ou 2 ans. De mémoire que pour certaines décisions stratégiques, nous avons pas gardé derrière. De de manière opérationnelle, mais qui avait quand même un résultat relativement positif, hein, on a, on était sûr quand même quasiment 60 % de bonnes mises en relation que nous. En tout cas, on aurait fait à la mano et ça nous a permis aussi de découvrir d’autres manières. En tout cas de de de trouver justement des des mises en relations pertinentes pour les start-up et les investissements. Et donc pourquoi en effet, on n’a pas utilisé le machine learning dans l’algorithme de notation? Il faut savoir que le le métier justement de la notation de l’entreprise.
– Adrien — 09:55 :
Comme les les, les grands qui notent des pays ou des banques ou des ou des grands comptes est un métier qui est très régulé, donc il faut être capable d’expliquer pourquoi telles données a pu donner telle note derrière, et le problème qu’on avait en tout cas à l’époque, avec le machine learning, c’est qu’on a toujours cette image de la boîte noire qui est pas forcément rassurante aussi sur le côté très factuel et donc on ne pouvait pas se permettre à l’époque de baser toute notre modèle d’analyse et de la notation et là valorisation d’entreprises sur un modèle qu’on a du mal à expliquer derrière. Alors certes, on n’est pas encore régulé. On y viendra un jour ou l’autre et donc on se prépare à cette phase de régulation et donc c’est ça qui pour l’instant nous empêche d’intégrer du machine learning dans la notation d’entreprise. D’accord, oui, le besoin d’expliquer, habilité et vraiment une limitation pour vous pour le l’appliquer tout à fait en pratique et en termes de valeur. Ce que vous aviez ciblé, donc cette mise en relation de start-up, est-ce que c’est quelque chose qui qui avait la valeur attendue? Alors, c’est en effet ça a une valeur. En fait, on a été assez surpris plutôt sur le le rendu. Déjà on s’attendait pas à avoir autant de choses positives, de bonnes mises en relation avec aussi peu d’informations. On avait fait le parti pris de donner le moins d’informations possible. Et de se baser que sur les pics des entrepreneurs et les tests d’investissement. J’ai envie de dire écrites à la mano des des investisseurs derrière, donc on n’était pas sûr de la donnée structurée. C’était là qu’était le challenge justement, et on gagne forcément beaucoup de temps que si un un analyste doit passer son temps à lire tous les péchés et toutes les thèses d’investissement et les connaître par cœur, on va perdre énormément de temps et c’est pas le but du jeu. L’autre intérêt aussi était de pouvoir un peu. J’ai envie de lâcher cet outil dans la nature et se connecter automatiquement, par exemple à LinkedIn où Twitter. On a des petits écrits bien entendu sur toutes les entreprises et potentiellement la récupération des articles un peu connexes et des investisseurs sur leur site internet. Pareil, on a c’est généralement la la thèse d’investissement de de Dispo et donc en fait on aurait pu avoir un outil qui est totalement autonome. On va dire dans dans de de de manière idyllique et pouvoir nous faire gagner à la fois du temps et potentiellement du business. Bien sûr la réalité est forcément différente, c’était pas aussi simple puisqu’il faut aussi pouvoir se connecter à tous ces ces ces ces systèmes là. Et derrière pouvoir avoir un un matching qui est parfait parce qu’on n’est jamais trop prudent hein, on peut avoir une une mauvaise mise en relation et puis nous forcément, si on se plante, c’est la notoriété destineo qui en prend un coup et c’est pas forcément le but du jeu. Il faut bien comprendre que le monde de l’investissement, que ce soit les start-up, les banques, les investisseurs et cetera, sont très critiques en règle générale, et il vaut mieux pas se planter avec ces acteurs là. D’accord et l’usage on va dire semi machine learning, celui dans lequel on a rien de mise en relation on va dire 5 mises en relations possibles et l’analyste fait le choix entre les 5, celui-là, il aurait été quand même impacté par ce problème de de régulation. Alors normalement non, puisque en effet le comme je le disais, c’est avant tout la partie purement analyse. Notation et valorisation on va dire qui est régulée bien sûr, le reste c’est plus d’on va dire du Conseil et dans ces cas-là ça ne rentre pas là-dedans. Mais il faut faire attention quand même, à l’image qu’on renvoie. Si demain on commence à dire dans tous les sens qu’estimée au fait du machine learning, oui, forcément l’image aussi de la notation va en prendre un coup, alors ça peut être très positif. Ça montre aussi qu’on est dans l’air du temps, qu’on est capable de transformer ces modèles, de voir une nouvelle application, justement aux machines learning comme beaucoup d’autres, mais il faut quand même faire attention à la régulation, à l’explication qu’il y a derrière. Je pense que dans ces cas-là, c’est plus simple d’être une grande agence de notation. De toute façon, c’est déjà une boîte noire, on le sait tous. Autant rajouter du machine learning et voir ce que ça sort. Nous, malheureusement, on n’en est pas encore à cette étape là, ça devrait pas tarder. Alors si on revient sur la data en général, quels sont aujourd’hui les limites, les goulots d’étranglement que vous rencontrez face à la data? Alors la limite en fait qu’on a actuellement, c’est justement qu’on a trop de données, on a trop de données qui certes et structurées mais qui est compliqué à analyser. Si je reprends cet exemple du gros formulaire, donc pour faire très simple un entrepreneur rempli environ 120 questions du de notre formulaire, on va dire public derrière le formule, le formulaire s’adapte et comble les trous manquants et à la fin, c’est comme si on avait un gros formulaire de de 100 ou 300 questions qui ont été répondues. On a environ 10000 startups maintenant sur estimée. Qu’on a analysé depuis 6 ans, on fait vite le calcul, ça fait beaucoup de données et à la fois pas suffisamment pour en tirer des énormes conclusions ou en tout cas par exemple faire tourner du machine learning derrière et avoir quelque chose de pertinent. En fait, on se retrouve un petit peu sur un entre 2 où on a beaucoup trop de données à analyser d’un point de vue humain, d’autant plus que ces données sont très vite obsolètes hein. Les startups sont c’est c’est c’est quand même un quelque chose qui évolue très rapidement dans l’air du temps tous les 6 mois ont il faudrait remettre à jour un peu toutes ces données là? Et bah nous c’est pas forcément le cas. Donc il faut à la fois trier l’obsolescence justement de ces données. Avoir suffisamment d’analyses pour trier les données actuelles et en sortir des soit des des des vérités générales ou ce genre de choses ou des ou des faits? Et puis potentiellement continuer à faire grandir cette base. Donc en fait cette masse de données qu’on a actuellement, on a du mal à la traiter. C’est vrai, on a du mal à en tirer des signaux faibles, on a du mal à à tirer, mise à part bien entendu certains critères qui sont bien entendu critiques pour les start-up, à savoir la maturité, le secteur qui sont les fondateurs. Ce sont des données qui bien entendu ont un rôle majeur dans une analyse. Il y a beaucoup de données derrière qui jouent également un rôle peut-être moindre, mais qui sont quand même pertinentes. Et c’est toutes ces données là qu’on a du mal, justement à analyser. D’accord, ça prendrait trop de temps aux analystes et exactement en termes de machine learning, où vous vous heurtez à des obstacles comme des données incomplètes parce qu’il y a des questions qui sont pas répondues. Et puis peut-être même un un manque de quantité. Si si on on va dans on a 10000 lignes, mais si on va dans une catégorie particulière de start-up, un secteur donné, on a beaucoup moins. Et finalement le le machine learning sera peut être limité en nombre de lignes, c’est c’est exactement ça. Et pour rebondir d’ailleurs là-dessus on aurait peut-être plus de facilité à réutiliser du machine learning si on prenait justement que certaines questions, par exemple une dizaine de questions du formulaire ou en effet, on a ces 10000 entreprises qui ont répondu un peu à ces questions et pouvoir en sortir quelque chose. Mais le problème c’est que 10000 entreprises fois 300 questions à analyser en même temps en fait, même si je faisais un un arbre de décision, ça partirait complètement en live. Et ça serait pas pertinent? Et là aussi alors ça c’est un, on y reviendra peut être plus tard dans le podcast, mais on a un manque cruel de personnes. Même en data analyst qui justement nous empêche de de de d’explorer, on va dire ces pistes là, on peut en parler maintenant par exemple, quelle est la répartition de de l’équipe sur les les sujets data? Alors malheureusement on n’a pas de profil spécialisé dans la data chez Siméo et ça nous manque cruellement et c’est un manque qu’on a depuis le début.
– Marc — 16:57 :
De de l’aventure hein, ça on on le sent de plus en plus maintenant. Et mais c’est vrai qu’on a des analystes tout de même voici donc plutôt du monde, de l’investissement et du financement qui eux prennent super bien le relais là-dessus Pour information, donc le formulaire qu’on a créé c’est grâce justement à des profils comme ça, donc ils comprennent tout de même les les tenants et les aboutissants. Un peu de de ces données là d’un point de vue tech, malheureusement on est limité, on est 3 dans l’équipe technique donc pareil ça limite les possibilités. Il faut bien comprendre qu’on n’est pas uniquement bien sûr sur des algorithmes de de notation où d’analyse. Derrière il y a toute une interface à faire, une architecture à faire, à faire vivre un site web. Et aussi toutes les petites demandes qu’on peut avoir du reste de l’équipe qui qui forcément prennent du temps et bien entendu le développement de nouveaux projets. Donc en fait, notre équipe technique est très réduite sur la partie donnée, même si c’est quelque chose qu’on essaie maintenant de de résoudre. Et on a derrière donc 3 analystes actuellement, vici qui s’occupent alors à la fois bien entendu de tenir par la main les start-ups dans leur processus d’analyse et d’en sortir des des données pertinentes. Mais au-delà de ça, d’essayer d’utiliser cette donnée accumulée pour en sortir soit des nouveaux modèles d’analyse. Que nous, d’un point de vue technique derrière, nous mettrons en place dans notre plateforme, soit sortir ce qu’on appelle des multiples de de sortie. Ce sont des multiples qui sont utilisés généralement dans des dans dans le monde de l’investissement pour savoir si tel secteur où tel secteur sera plus pertinent qu’un autre peut sortir des plus grosses valorisations et donc des plus grosses investissements derrière. Donc nos analyses sont aussi pas mal sur ce côté un peu R et d autour de de la donnée d’investissement. D’accord, donc, c’est des experts métiers qui se sont faits à la data analyse et du côté tech on va dire des Software Engineers qui se sont faits data Engineering. C’est exactement ça. On fait un peu avec les moyens du bord et alors si tu devais recruter tes premiers du coup data Scientist, Data Engineer, Data Analyst. D’ailleurs je sais pas quel vers quoi tu te dirigés en premier mais sur quels critères tu te baiserais étant donné que c’est pas forcément mon mon cœur de métier. À l’origine, la data, même si j’ai un profil technique. Déjà, je fais appel à toi pour me conseiller, ça c’est certain. Au-delà de ça, je pense que je prendrai un profil qui est avant tout un petit peu dans l’exploratoire. Le but du jeu, c’est qu’il y a tout à faire dans cette partie data analyst. J’ai besoin d’avoir une personne qui qui soit, j’ai envie dire qui a un fort esprit de de à la fois bien sûr t’analyse mais aussi de force de proposition. C’est pas comme si je pouvais mettre quelqu’un derrière un mentor justement pour gérer cette personne là et là faire.
– Adrien — 19:32 :
Grandir sur son sur le la data analyse. Au contraire, il faut qu’il y ait une personne qui est un peu cette hype entrepreneur capable de prendre des risques et des décisions, quitte à se planter, c’est pas grave, mais en tout cas réussir à voilà à sortir quelque chose de cette masse donnée peut être même simplement une direction à prendre. Ça sera déjà pas mal et bien sûr travailler un peu main dans la main avec nos analystes ici, d’accord force de proposition et puis capacité capacité à travailler avec l’équipe exactement. Est-ce que tu as une anecdote à partager sur la la data est ce que vous avez découvert? À un moment donné, dans vos travaux, alors j’ai une anecdote. En effet, sur la data qui est pas très pas très glorieuse bien entendu ça remonte au tout tout début destineo donc on venait de de terminer la phase Excel, on passait sur notre première architecture et il faut bien comprendre que moi je je sur la partie technique j’ai pas trop de soucis, je me débrouille plutôt bien sauf la donnée et je flippe de la donnée. C’est la chose qui me fait peur donc tout ce qui était base de données je ne connaissais pas donc j’apprenais un petit peu sur le tas. Beaucoup d’entrepreneurs d’ailleurs, surtout que j’étais Sortie d’école à cette époque là, donc j’avais pas eu encore une expérience professionnelle et ma base de données était opérationnelle. On architecture était opérationnelle, la plateforme fonctionnait bien, les premiers clients arrivent, et cetera. Je venais juste de faire les sécurités de ma base de données à savoir justement qu’elle soit bien chiffrées, qu’on puisse pas y accéder aussi facilement que ça, qu’il y ait des backups tous les jours, un petit peu de de cette base de données et un soir, en revenant du bar vers minuit minuit et demi. Un technicien d’o VH m’appelle et me dit bah en.
– Adrien — 21:10 :
Fait, vous avez plus rien sur votre serveur, vous êtes fait à quai, votre base de données. Et puis là, d’accord, là énorme flip, qu’est-ce qui se passe? Qui est venu? Qui nous a piqué la donnée et ce qu’il a réussi à accéder à quelque chose, et cetera et cetera. Et en fait, on s’est retrouvé sur ce fameux. Système du du RANSOMWARE, on demandait de payer un Bitcoin pour récupérer mes données, d’accord ce qui d’ailleurs m’a amené un petit peu à la face. Cybersécurité Secure, juste après, mais mise à part ça, c’est un énorme flic parce que du jour au lendemain, on voit sa base de données disparaître, potentiellement des clients qui sont en plein en pleine analyse, qui ont payé des centaines, des milliers d’euros pour avoir leur analyse. Bah non seulement on risque de leur dire bah au fait, on a plus vos données, faut tout recommencer, mais en plus vos données risquent d’être dans la nature. Alors bien entendu c’était pas le cas-là la base de donnée était bêtement supprimée parce que sur ce coup là, j’avais bien fait une semaine avant mais sécurité était nickel, personne ne pouvait entrer ou en tout cas pas facilement bien entendu et la seule chose possible était simplement de m’embeter en supprimant on va se donner et coup de chance j’avais mis mes backups avant en place quelques jours avant donc ça s’est plutôt bien goupillé dans mon malheur je m’en suis sorti mais ça a été le premier gros coup de flip autour de la donnée que j’ai eue chez timéo, c’est de se dire Wow, y a quelqu’un qui est arrivé qui d’un seul coup en fait a tué mon business en en 1h même pas. Et on se dit, mais comment on peut se relever de ça ça fait déjà 6 mois qu’on travaillé dessus. Ce que ça veut dire que ça fait 6 mois qu’on de travail qui a été perdu et en fait on commence d’un seul coup un peu à paniquer, à essayer de prendre des décisions et en fait heureusement avec mon associé on s’est posé, on a rationalise un peu ça. On s’est dit qu’il y avait pas mort d’homme, la donnée n’avait pas fuité, n’avait pas disparu, c’était simplement supprimée. On a simplement rollback donc remis un backup de notre base de données, tout s’est bien passé, on a refait nos sécurités et maintenant ça fait 6 ans qu’on n’a pas eu une seule brèche ou quoi que ce soit. Je touche du bois bien entendu pour pour la suite, mais voilà, ça a été quand on, quand on a quelque chose qui touche à la donnée et qu’on sait que ça nourrit absolument tout, le business, nos algorithmes, notre notoriété, un peu tous ces sujets là et Ben oui, c’est un coup de flip quand il quand il arrive quelque chose, donc il faut être enfin réussi à être certain qu’elle avait pas fuite. C’est parce que vous auriez pu vous faire voir par le bluff finalement. Alors oui, on aurait pu se faire avoir par le bluff alors en effet on a alors merci, je remercie encore 6 ans après le technicien d’O VH qui a passé la nuit. Avec moi au téléphone, qui avec qui on a bien entendu regarder tous les logs, les connexions, qu’est-ce qui a transité sur le serveur? Il y a des choses qui ont été sorties ou non et rien ne correspondait à la base de donnée et donc la base donnée étant était correctement chiffrée avec une belle authentification qui venait juste d’être fait. Donc y a pas de raison qu’un mot de passe est fuite ou une clé d’autorisation donc sur ce coup là on a il y avait pas de souci sur la base de données heureusement après on peut jamais être sûr de rien sur de tout pardon bien entendu mais je flipperai plus maintenant. Que, à l’époque à l’époque, heureusement, ça soupe le billet bien d’une certaine manière. Vous avez pas eu de nouvelles des ceux qui faisaient du chantage aux armes sur moi? Jamais toute façon j’avais pas mon bitcoin à à donner à l’époque en tout cas. Alors, quels conseils tu donnes sur la cybersécurité à à ceux qui démarrent une boîte, alors sur la, sur la cybersécurité c’est déjà pas prendre à la légère. Bien entendu tous ces tous ces risques et toutes les mesures qu’on peut mettre en place qui sont relativement simples d’ailleurs à mettre en place, ça peut être bien entendu simplement ce rôle un peu pédagogique avec ses équipes, faire attention à ses mails et compagnie, faire attention aux données qu’on qu’on rentre et surtout aux données qu’on sort ça. J’explique continuellement à mes équipes que quand on sort des données sur un format Excel. Ce sont des données qui ne sont plus protégées à proprement parler. Si l’Excel vient affûter potentiellement, ce sont des données critiques qui sont à l’extérieur, alors heureusement j’en pêche bien sûr, toutes sorties de données critiques sur un Excel, ça va de soi, donc ça va être plutôt les pitch des entreprises, éventuellement les fondateurs. Bref, des données publiques où semi-publiques, mais donc il faut faire attention à ça. Au-delà de ça, et C’est d’ailleurs ce qui touche à la donnée, c’est bien entendu sans entourer de quelqu’un qui est capable de maîtriser un petit peu la donnée sur tous ses aspects, que ce soit bien entendu. La sécurité, comment la traiter et derrière, intervenir dans la stratégie pour correctement valoriser on va dire les données de l’entreprise. C’est comme je disais tout à l’heure, un profil qui nous manque depuis le début. Moi je regrette de pas avoir eu cette compétence, à savoir correctement gérer et analyser la donnée, en sortir, soit des signaux faibles, soit une une, une forte valeur ajoutée et en fait, au début on a un petit peu ramé là-dessus, ce qui nous a peut-être fait perdre du temps, mais qui a été très enrichissant pour nous et bon Damien, ça a mené à estimer no d’aujourd’hui, donc je vais clairement pas me plaindre. Mais c’est vrai qu’un voilà un profil data, c’est quand même très pertinent dès le début, un petit peu du de de l’aventure, c’est ce qui nous a manqué. Et comme tu disais, vous vous baignez dans le monde de la finance et le CE qui fait foi dans la finance, c’est Excel, donc vous êtes un peu obligé quelque part en en input et output d’avoir du Excel. Alors oui, en input en août tout à fait. D’ailleurs je je même si je me bats régulièrement avec mes analyses et mes bedave pour éviter justement d’avoir de l’eau dans tous les sens que je dois intégrer. Soit la mano, soit semi automatiquement dans dans la base de données. Bah ça reste quand même le le, le quelque chose de très classique, le béaba un petit peu de la communication. On a lancé il y a quelques quelques années le guide des accélérateurs et incubateurs en en France qui recense tout le monde et Ben en fait tous les partenaires grands comptes utilisent Excel. Nous on a utilisé type forme pour récupérer toutes les données et bien sûr type forme à la fin, c’est Excel donc finalement il faut réussir à traiter cette donnée au format vraiment tableau basique. Et derrière, réussir à l’enrichir le plus automatiquement possible. Parce que quand on a bien sûr des milliers, des milliers de lignes, on n’a pas envie de se les farcir à la mano. Donc c’est voilà typer correctement sa donnée l’intégrer correctement. Et puis surtout avoir ce rôle un petit peu pédagogique auprès de ses équipes en disant, Bah si vous plaît utiliser de moins en moins XL peut-être hésitez pas à nous demander des développements en interne pour peut être faciliter un petit peu à la fois le transfert de données, la récupération des données et les intégrer correctement à la base de données. Donc ça c’est vraiment un sujet un peu un peu compliqué. Mais qui est très très très pertinent, en tout cas en ce moment. Si t’as un conseil à donner à quelqu’un qui sort d’école, qui voudrait qui voudrait soit intégrer une structure comme la tienne, soit soi-même, monter une boîte comme la tienne. Qu’est-ce que tu donnerais comme Conseil alors le premier conseil que je donne généralement, c’est oser, entreprendre, oser, prendre des risques, oser faire quelque chose pour plusieurs raisons. Déjà, c’est ce qui nous permet aussi de sortir de la masse, d’éviter d’être un anonyme parmi tant d’autres et derrière de Ben, d’avoir un impact en fait. Finalement, sur ce qu’on fait, que ça soit un impact business, un impact technique, même un impact sur le réseau ou tout un écosystème? Il faut avoir cette cette prise de risque. Personnellement, quand je suis sorti des études, j’étais loin d’être le meilleur. J’étais pas dans j’étais, on va dire dans la moyenne voire moyenne basse. J’ai jamais été très bon. J’ai eu mes toutes mes années un petit peu au rattrapage. J’ai redoublé ma première au lycée, et cetera et cetera, donc rien ne me destinait, on va dire à monter une boîte, à être dans le dans le fameux classement Forbes. Mais au-delà de ça, j’ai essayé de faire des choses pendant mes études, donc j’ai commencé à être responsable du BDE J’ai commencé à donner des cours dans mon école pendant que j’étais encore étudiant. Et puis finalement, j’ai pris le risque de l’entrepreneuriat, là où généralement les techs partent rapidement dans des grands comptes ou dans des supers jobs bien payés. Bah moi j’ai pris le parti pris de monter ma boîte et de pas me payer pendant 2 ans. Au contraire de mettre de l’argent pour payer mes salariés. Alors certes, c’est une phase compliquée. C’est vrai qu’il y a ce côté un petit peu se faire violence pour que ça marche, mais au-delà de ça, ça m’a permis d’avoir Ben non seulement des belles compétences techniques parce que j’ai dû toucher à tout au début chez siméo d’avoir également des compétences plus business, plus managériales que je n’avais pas enfin. Vraiment pas, bien entendu. En école et derrière de à la fois créer un réseau d’être ici sur le podcast aujourd’hui, de sortir un petit peu de de cette masse et ça change tout. Mais si par contre je dois donner quand même un petit conseil, que moi je n’ai pas eu la chance d’avoir à l’époque, c’est de trouver quand même un mentor, un mentor sur ces sujets de prédilection qui va nous aider un petit peu, pas forcément comme un manager hein. Nous dire ce qu’il faut faire ou non, mais plutôt être de bons conseils, parfois, réussir à nous faire sortir la tête de l’eau, ça c’était quelque chose de de critique, que mon associé et moi on n’avait pas à l’époque. Et donc on s’est lancé dans l’entrepreneuriat sans forcément en comprendre les tenants et les aboutissants et en essayant de nous dépatouiller un petit peu de ce monde de requin qui, en plus, l’investissement et finalement, on s’en est sorti et c’est maintenant moi qui ai un peu ce rôle de mentor, que ça soit sur la partie technique où business, auprès de certaines start-up, que que j’accompagne plus personnellement. Je me permets de revenir sur le sujet de la cybersécurité parce qu’il est-il est hyper intéressant. Aujourd’hui, on démarre une boîte, on a l’impression qu’on est petit, on se dit, on est en sécurité. Finalement, Ben on l’est pas comme tu, comme tu l’as dit en on peut être attaqué par un somewhere, est-ce que t’as des références, des pointeurs de lecture, de de cours pour se former rapidement à la cybersécurité? Quand on est sorti d’école? Et donc malheureusement en France, souvent un peu délaissé sur ce sur ce sujet. Alors oui, il y a plusieurs points de départ. Déjà quelque chose qui est, qui est critique et qui est auquel il faut se renseigner, c’est l’État. On dirait pas comme ça, mais l’État est l’est le premier soutien un petit peu de de ce monde cyber. Donc on a l’anssi, l’Agence nationale de la sécurité des systèmes d’information qui est là justement pour non seulement donner des bonnes recommandations pour les systèmes d’information, bien entendu pour les entrepreneurs qui souhaitent se lancer et aussi un petit peu les axes stratégiques du moment autour de la cyber. La cyber, c’est quand même un un monde qui est en train de monter actuellement en France, notamment depuis quelques années, on voit la création du du campus cyber à à la défense à Paris, qui est censé être le lieu européen de la cyberdéfense. On arrive d’ailleurs à faire travailler ensemble des directions de de sécurité de grands groupes ensemble, des start-ups, des banques. L’état également. C’est vraiment un, un lieu, un petit peu vivant mais qui montre aussi qu’il y a une réelle problématique. Il y a eu une explosion des attaques cyber. Pendant la crise du COVID qui ont fait bien entendu beaucoup de dégâts dans les grands comptes, dans les infrastructures publiques, notamment les hôpitaux qui ont mené à à des drames, mais aussi auprès des startups. Et c’est malheureusement d’ailleurs les start-ups, généralement un sujet qui passe un petit peu à la trappe comme tu le disais, on peut pas se cibler tous les tous les problèmes à la fois d’une start-up. Alors généralement, on se focus plutôt sur bah mettre en place déjà une une architecture technique, c’est déjà pas mal. Et puis derrière commencer un peu son premier business et voir un petit peu stratégie. Mais on n’a pas une personne Ben à la fois, comme je l’avais en en analyse. Qui cette personne qui nous manquait, on l’a pas forcément non plus en cyber comme on l’a pas dans d’autres verticales et ça pose problème. Donc il faut pas hésiter à se former. En effet auprès de de de de sites classiques, alors ça peut être l’anssi, ça peut être même sur des stack overflow et compagnie, donc ces fameux sites de référence un petit peu sur le béaba technique y a quand même des des bonnes idées là-dessus, il faut se tenir au courant aussi des actualités. Souvent les actualités sont la première source un petit peu de de fille que l’on peut trouver. Et donc potentiellement, quand on connaît une faille, on peut mettre au moins un petit bout de sparadrap au début avant de réellement avoir quelqu’un qui va complètement cimenter la brèche d’une certaine manière. Et donc c’est déjà mieux que rien. Mais en tout cas, il faut-il faut absolument se documenter. Il existe beaucoup de services, beaucoup de startups qui se lancent là-dessus, souvent des start-up qui connaissent aussi les galères de budget des autres start-up et donc qui ont des prix beaucoup plus attractifs. On va dire pour sécuriser tout 1S qui est en train de se créer, donc il faut pas hésiter à faire appel à ces gens-là C’est c’est un très très bon investissement et qui en plus sera bien vu demain si une personne souhaite. Lever des. Et un ordre de grandeur de de ce que ça coûte une formation en cybersécurité. Alors en règle générale, pour ma part, c’est plus en effet des grands comptes que je cible, donc on n’est plus sur des des formations a entre 5 et 10000€ sur plusieurs jours. En règle générale pour les start-ups, ce sont plus des coachings qui vont se faire sur 1h 2h voire une demi-journée à la fois sur des équipes techniques et non techniques comme je disais, y a un gros problème de pédagogie auprès des auprès des personnes et surtout celles qui n’ont pas conscience un petit peu des dangers et dans ces cas-là on n’est plus sur des coachings à 100€ par personne ou ce genre de choses d’accord et ça, ça peut suffire à à éviter des énormes problèmes. Et dans somewhere, tout à fait. En fait, on va éviter les plus gros risques. Il faut bien comprendre quand même que les les plus gros problèmes de sécurité et ce qui mène généralement à une sortie des données d’un d’une, d’une entreprise et parfois des données qui sont critiques se sont généralement bah soit des arnaques présidents ou en tout cas ce genre de de problème ou on se fait passer pour un collaborateur ou on demande en effet par exemple un des données sur l’entreprise, des comptes bancaires ou ce genre de choses qui parfois. Ce sont des requêtes qui sont presque légitimes de la part d’un collaborateur, mais si on fait très attention à l’origine du mail par exemple qu’on a reçu et Ben on voit que parfois le nom de domaine différent d’un caractère. Moi j’ai déjà reçu à titre d’exemple des e mails d’un certain adrien fenech, tout comme moi ou son adresse mail était exactement pareil. Sauf que c’était estimée avec 2 point com. D’accord c’est vrai que quand on regarde un petit peu dans le détail, on voit le problème, mais comme on a tous l’habitude de lire les mails un petit peu en diagonal, j’ai généralement on ne voit pas ça. Donc il faut faire attention à ces petits sujets là, et c’est justement de la pédagogie que les équipes ont le plus besoin. Alors j’ai estimé Léo, vous, vous avez la gestion de data en interne, mais vous voyez aussi de loin, on va dire de près ou de loin d’ailleurs, un certain nombre de start-up, plus de 10000 depuis le début. Qu’est ce qu’on peut en apprendre? De 10000 start-up analyses? Alors oui, on apprend beaucoup de choses et bien entendu de cette donnée. Alors ce qui est intéressant déjà, c’est de voir que ce qu’on apprend en fait n’est pas figé dans le marbré et toutes les conclusions qu’on a pu tirer sur les premières années ont toutes été remises en question aujourd’hui. Et de la même manière, les conclusions qu’on tire aujourd’hui vont seront de toute façon, remises en question dans quelques années. Cela fait suite tout simplement à un écosystème qui évolue à un monde de l’investissement qui évolue aux mentalités aussi, qui évolue, à titre d’exemple. Au tout début, quand nous cherchions un petit peu rationaliser un peu ce monde de l’investissement, de la notation, du jugement, un petit peu finalement sur les entrepreneurs, on allait embêter les business angels en demandant bah Voilà pourquoi tu investis dans les start-up et pas dans l’autre, et donc, à force de rationaliser, on avait justement certains critères qui se dégageaient. Ah mais là, ils étaient 2 cofondateurs et 2 cofondateurs. C’est plutôt bien. C’est mieux qu’une personne toute seule. À l’inverse, ils sont 6, c’est beaucoup trop, ça va être galère de tirer des conclusions ou des décisions dans l’entreprise et on va avoir également d’autres critères qui malheureusement sont pris en compte par les business angels ou les investisseurs que nous en tout cas, on a fait le choix de ne pas prendre en compte par exemple l’origine des fondateurs, le sexe des fondateurs aussi y a 6 ans. Oui, c’était compliqué d’en effet de lever de l’argent si malheureusement on était une femme entrepreneuse et qu’on était toute seule. Pour peu qu’on ait une mère célibataire, c’était terrible. Et ce qui est le plus terrible, c’est de voir des décisions d’investissement qui sont censés être, en plus des décisions business, rationalisées et cetera. Et Ben mêlées, autant d’affects et d’humains, et d’avoir tellement de jugements sur l’humain derrière que ça va empêcher un investissement, empêcher une parfois une bonne idée d’éclore et compagnie. Heureusement, tout ça est en train d’évoluer, y a encore beaucoup de chemin à faire, mais nous, on le voit dans nos données. Maintenant, on a de plus en plus en faisant du backtesting hein, de de start-up qui sont passés par nous, qui ont été fondés, par exemple par des femmes ou par des réfugiés, et cetera. Qui lève plus de plus en plus facilement, même si ça reste compliqué des fonds et ça, on le voit grâce à la donnée. On le voit pas forcément grâce aux articles qu’on peut voir dans la presse étant donné que les de sont pas forcément annoncées d’ailleurs. Donc ça, on le voit de plus en plus et nous, ça nous force aussi à adapter nos modèles d’analyse quand ça devient d’une certaine manière un jugement qui est positif, qui met en avant. Je pense notamment à à Singa, qui a lancé un fonds d’investissement qui investit uniquement si au moins 30 % de des des du capital est détenu par des femmes. Il va peut-être mettre en avant un peu plus justement, ces start-up qui sont fondées par des femmes qui sont, je pense, manger suffisamment de bacs jusqu’à présent et qui ont le mérite de toujours exister, de toujours se battre et de continuer à les aider à avancer là-dessus Et donc toutes ces données là qui étaient à la fois tabous et qu’on souhaitait pas prendre en compte avant. Maintenant on peut enfin les prendre en compte parce qu’elles permettent de valoriser correctement une entreprise. Et c’est là où ça devient intéressant, c’est qu’on a réussi. En tout cas, l’écosystème n’a pas forcément un stylo. Qui m’a rationalisé et à rendre positif quelque chose qui a encore quelques années, était très négatif et forcément mal vu, et donc c’est très bien que les fassent se jettent là-dessus, se lancent un peu sur ces domaines là, tout comme les réfugiés, tout comme sur certains sujets qui sont critiques et qui sont parfois difficiles à aborder. Mais on a une vraie libération là-dessus. Alors comme je disais, y a encore beaucoup de chemin à faire. Et pour revenir justement sur ces données qui évoluent chaque année, oui, on voit par exemple l’impact, tous ces sujets un petit peu autour de la gouvernance, de l’économie, de de l’écologie. Pardon et du social.
– Adrien — 38:48 :
Qui jusqu’à présent était enfin jusqu’à présent jusqu’à il y a quelques années, n’était pas forcément pris en compte. Il n’avait pas forcément d’impact sur la valorisation. La notation des entreprises. Maintenant, c’est un sujet qu’on nous demande continuellement, comment on valorise l’impact et est-ce qu’y a une dimension écologique dans ce projet et ce que par exemple tel projet Labellisé Solar Impulse donc, ce qui veut dire que d’un seul coup, c’est un projet qui va exploser et donc c’est intéressant de voir ces données qui changent entièrement. Ces modèles d’analyse, qui changent entièrement et finalement, on va avoir un métier qui se réinvente. Constamment pour conclure chez siméo les prochaines étapes, l’avenir, qu’est-ce que c’est, alors les prochaines étapes pour pour répondre à cette question, je vais obligé de revenir en arrière encore une fois et de de te raconter un petit peu la Genèse destineo. Au tout début, on a fait le parti pris avec mon ancien associé, de mettre uniquement de l’algorithmique et de la data au cœur de nos analyses, donc c’est à dire enlever l’humain. On partait du principe que l’humain était le problème. Et que pour avoir une vraie notation, une vraie analyse, une vraie valorisation, il fallait rationaliser, rester très factuel et donc enlever tout l’affect. Bien entendu. On s’est planté au début. Certes, on a accumulé beaucoup de données avec des modèles très intéressants, mais en fait, ce que je cherche les investisseurs, c’est justement à ce qui est une personne qui remet en mains propres le dossier, même si c’est exactement le même dossier qui est exactement. C’est ça, quelqu’un qui prend la charge, la responsabilité de cette analyse. Depuis, on a rajouté de l’humain et on a essayé d’équilibrer. À la fois l’automatique, la technique. Donc, comme je disais l’aide un petit peu, l’analyse que l’on donne à nos analystes et l’humain, à savoir les analyses qui vont avoir à la fois bien, bien entendu ce rôle d’analyste auprès de des start-up, hein, de d’en sortir vraiment des conclusions, et cetera. Et ce rôle pédagogique, et en fait les prochaines étapes, ça va être progressivement et avec beaucoup de pédagogie auprès de nos clients, enlever un petit peu plus l’humain pour rajouter un petit peu plus de factuels. Un peu plus d’algorithmes et de pouvoir un petit peu plus industrialisés. Finalement, ce modèle d’analyse. Donc nos prochaines étapes, ça va être de mettre en place une plateforme automatique de notation et de valorisation à disposition. Un petit peu finalement de de tout l’écosystème, donc ça va être les investisseurs bien entendu pour pouvoir valoriser à date leur portefeuille ou éventuellement des entreprises dans lesquelles sont investir. Comme je disais, les incubateurs accélérateurs pour noter continuellement un petit peu la progression de leur batch de start-up. Les investisseurs pour se les pardon, les grands comptes pour se rassurer un petit peu sur la fiabilité de de ces entreprises. Et les banques mais entendu pour de la notation. Au-delà de ça, on va également outiller certainement des des concurrents ou des semi concurrents, même s’ils sont indirects parce qu’on a beaucoup d’on est beaucoup sur le marché. Mine de rien à essayer d’accompagner les jeunes pousses dans leur démarche de financement et en règle générale, sur leur stratégie. Et on va pouvoir mettre à disposition ces outils là à toutes les personnes qui souhaitent aider un petit peu les entrepreneurs dans leur stratégie et leur futur. D’accord, Ben c’est alléchant et c’est pour quand à peu près, on va dire de début 2023 Nous sommes actuellement en test de ces outils là super, Eh bien merci beaucoup Adrien, merci Marc. Merci d’avoir écouté data-driven One One si vous avez aimé, n’hésitez pas à vous abonner à la chaîne, à liker et à partager. La semaine prochaine, je recevrai Guillaume Jouffre si o de gringo pour nous parler de son expérience avec la data à très vite. o