Entretien avec Hiyu Shintani, cofondateur d'Histia
Suite de nos échos à l’édition 2024 de Paris-Saclay SPRING avec, cette fois, le témoignage de Hiyu Shintani, cofondateur d’Histia, qui propose un générateur de documents sourcés.
- Si vous deviez, pour commencer, pitcher Histia ?
Hiyu Shintani : Nous proposons un générateur de documents à partir d’informations sourcées et fiables. L’intérêt pour l’utilisateur : il ne consacre plus son temps à faire des recherches rébarbatives sur Internet pour établir la biographie d’une personne, la présentation d’une entreprise, une étude de marché ou tout autre document de ce genre. C’est un outil grandement prisé par les banques et les cabinets de conseil, qui grâce à nous, obtiennent en quelques minutes des documents qui leur prenaient auparavant des heures à rédiger. Notre solution permet d’automatiser ce travail en structurant les informations dans un document facile à exploiter.
- Quelle est la valeur ajoutée de votre solution par rapport à des modèles de langage de type ChatGPT ?
H.S. : Nous nous différencions fondamentalement de GPT en ceci que ce modèle a été entraîné pour fonctionner comme un modèle de langage : il analyse des corpus de textes pour apprendre à prédire le mot qui peut succéder à un autre dans l’énoncé d’une phrase. Il se décline aussi sous forme d’assistants vocaux avec lesquels on peut engager une conversation. C’est donc essentiellement une IA spécialisée dans la compréhension du langage (qu’il soit parlé ou écrit). En cela, c’est une innovation qui force l’admiration. Sauf que le risque est que l’assistant veuille à tout prix répondre à l’usager quitte à ce que ce soit au détriment de la qualité de l’information – je pense particulièrement au risque d’hallucination, un phénomène qui se produit quand GPT invente quelque chose de parfois totalement loufoque lorsqu’on lui pose une question à laquelle il ne sait pas répondre. ChatGPT est donc avant tout un outil grand public qui est manifestement conçu pour fournir une expérience utilisateur plaisante…
- Ce n’est pas le cas d’Histia ?
H.S. : Si, bien sûr, mais chez nous cette expérience plaisante ne se fait pas au prix d’une information peu fiable ! Histia donne à l’utilisateur tous les outils nécessaires pour qu’il puisse contrôler la qualité d’une information. À chaque source mentionnée correspond un score relatif à son degré de fiabilité.
- Qui a défini ce score de fiabilité ?
H.S. : Nous calculons nous-mêmes ce score de fiabilité. Il est combiné à un système de sourçage inédit qui nous permet de croiser les sources et d’afficher à l’utilisateur, pour chaque information de son document, toutes les sources et les phrases exactes de chacun des sites qui la valident.
- Pourquoi Histia ?
H.S. : Hist en référence à l’étymologie grecque du mot histoire, qui signifiait alors « enquête ». Enquêter, c’est précisément, ce que notre technologie permet de faire : elle enquête dans la masse d’internet, pour y dénicher des pépites d’information. Notre technologie s’inscrit par ailleurs dans la grande famille des Intelligences Artificielles. De là, la terminaison de son nom –ia.
- Le propre de la personne qui enquête – qu’il soit historien ou journaliste – est de vérifier ses sources. Une autre analogie avec votre technologie qui, comme vous l’indiquiez, permet à l’utilisateur de connaître la source de son information et son degré de fiabilité avec néanmoins cette différence : l’automatisation de ce travail de vérification.
H.S. : En effet. Au détail près que nous construisons Histia sur des valeurs et des objectifs de transparence et non pas sur des arguments commerciaux trompeurs. Nous n’avons pas la prétention de dire, parce que nous automatiserions la vérification, que notre IA propose constamment de l’information 100% fiable. C’est parce que nous la développons nous-mêmes, que nous en connaissons bien les défis et que nous savons à quel point c’est impossible de parvenir à une information « pure », vu toutes les fausses informations et les biais d’informations qui prospèrent sur Internet. Non, ce que nous promettons à nos clients, c’est de leur fournir le meilleur outil possible afin de mieux juger de la véracité de la donnée, et de décider par eux-mêmes si elle est fiable où non. En bref : une IA transparente au service de l’utilisateur, qui lui facilite le travail, mais ne décide pas pour lui. C’est comme cela que nous concevons la relation entre l’Humain et l’IA.
- Un mot sur votre associé et les circonstances de votre rencontre, la constitution de votre duo.
H.S. : Nous nous sommes rencontrés il y a plus de cinq ans sur Internet lorsque nous étions encore lycéens. Nous créions des logiciels ensemble, dont un qui a comptabilisé plus de deux millions de téléchargements ! Depuis j’ai intégré CentraleSupélec et mon associé, Léopold Servais, HEC Paris. Nous formons un bon duo, moi apportant mes compétences en ingénierie numérique, lui dans l’aspect managérial – Il a fait des stages dans de grands groupes et des cabinets de conseil, et a pu constater le temps que des collaborateurs perdaient dans des recherches à répétition sur internet, comme celles que j’évoquais. Il m’a alors fait part de son idée et j’ai tout de suite accroché ! Ainsi est né Histia ! Je suis le domaine de l’IA générative de près depuis 2019 et la sortie de GPT2. J’ai donc tout de suite réalisé le défi technique qu’il allait falloir relever, et c’est ça qui m’a plu. Nous avons très vite réalisé un premier projet pilote qui a fini de nous convaincre de la faisabilité technique et du potentiel de la solution.
- Où en êtes-vous dans votre développement ?
H.S. : Dès janvier de cette année 2024, nous avons intégré l’incubateur d’HEC, ce qui nous offre la possibilité d’être accompagnés par des experts dans divers domaines de compétences. Nous sommes actuellement en plein dans notre phrase commerciale. Nous avons déjà lancé un projet pilote en collaboration avec une grande banque, et nous lançons aussi des cas d’utilisation dans plusieurs autres entreprises qui ont fait part d’un grand intérêt pour notre technologie.
- Qu’est-ce qui vous a prédisposés à cette sensibilité à la fiabilité des sources ? À un intérêt pour les sciences humaines et sociales dont l’enquête est pour beaucoup une composante de leur méthodologie ?
H.S. : Ces SHS ne me sont pas étrangères, pas plus qu’à Léopold. Nous avons dans nos cursus respectifs des enseignements dans ces disciplines. Mais je crois que, pour ma part, cette sensibilité doit davantage au souci de rigueur inhérent à mon esprit d’ingénieur et scientifique. En tant que tel, je ne prétends pas partir en quête de la Vérité absolue. D’ailleurs, existe-t-elle ? Une chose est sûre, je suis animé par le souci de me rapprocher le plus possible de ce qui y ressemble. Je ne peux me satisfaire d’une information dont je ne peux apprécier le degré de fiabilité. En cela, ChatGPT et les IA en général font courir de grands risques en termes de propagation de fausses informations. Je ne dis pas que c’est le règne de l’intox et de l’erreur. Non, des textes produits par ce modèle de langage ne souffrent pas la comparaison avec des textes écrits par des scientifiques. En apparence, du moins. Pour autant, on ne peut prétendre s’en satisfaire, faute de pouvoir en connaître les sources et le degré de fiabilité de celles-ci.
- Nous réalisons l’entretien sur votre stand de Paris-Saclay Spring. Qu’attendez-vous de cette journée ?
H.S. : De nouveaux contacts avec de potentiels clients, mais aussi d’autres startuppers, pour comprendre les défis que leur pose l’IA générative. C’est d’ailleurs tout l’intérêt d’évoluer dans un écosystème comme celui de Paris-Saclay : on y rencontre d’autres startuppers avec qui on peut échanger, y compris sur d’autres défis, ceux auxquels est confronté l’entrepreneuriat innovant ; on peut y identifier de nouveaux partenaires, etc. Un autre de ses intérêts est de pouvoir y rencontrer aussi des chercheurs, connaître l’état de l’art de la recherche. Un atout pour une start-up comme la nôtre, qui relève de la DeepTech, un domaine d’innovation, mais aussi de recherche s’il en est.
- Une dernière question dont j’assume l’apparente incongruité : nous réalisons un entretien sur le mode de la conversation… Que pouvez-vous dire pour me rassurer quant à l’utilité de l’exercice dans un monde où l’IA générative est appelée à occuper une place croissante ? De mon point de vue, l’intérêt est évident : je vous ai posé des questions auxquelles vous ne vous attendiez pas, et vous, vous m’avez donné des réponses aussi inattendues… Sans compter toute la communication corporelle qui éclaire le sens du propos. Mais, pour vous, quel intérêt y voyez-vous personnellement ?
H.S. : Récemment, GPT a connu un nouveau développement avec GPT4o, qui propose un assistant vocal ayant toutes les apparences d’un être humain dans sa manière d’interagir avec l’utilisateur. Alors oui, on peut se poser la question. Pourquoi ne pas imaginer une interview avec ce genre de machine ? En réalité, ce n’est pas forcément la meilleure façon d’envisager le futur de l’IA. Pour ma part, je ne la conçois pas autrement que comme une sorte d’assistant. D’elle, je n’attends pas qu’elle se substitue à moi dans toutes les tâches que j’ai à faire, mais qu’elle me permette de les remplir de manière optimale, en m’évitant de perdre mon temps à faire ce qui est fastidieux et automatisable. J’attends aussi d’elle qu’elle me conseille, me suggère des pistes que je n’aurais pas pensé explorer. Craindre qu’elle puisse se substituer à l’humain, c’est mal en comprendre l’intérêt et le potentiel. Cela fait deux ans qu’on nous annonce qu’avec l’essor de l’IA générative nous devrions assister à la disparition des développeurs informatiques. C’est le contraire qu’on observe : le défi est tellement immense que non seulement on a encore besoin de développeurs, mais encore le travail de ses derniers gagnent en efficacité grâce justement à ce nouvel outil qu’est l’IA générative. Celle-ci permet de compléter de manière automatique des morceaux de codes, contribuant ainsi à accélérer leur développement. Et ce que je dis des développeurs vaut pour les journalistes : l’IA peut les aider à gagner du temps dans la vérification de l’information et leur permettre ainsi de se consacrer pleinement à d’autres tâches à forte valeur ajoutée.
Journaliste
En savoir plus