Pourquoi les entreprises d'IA ne évoluent pas toujours comme les logiciels traditionnels …

Au niveau technique, l'intelligence artificielle semble être l'avenir du logiciel. L'IA montre des progrès remarquables sur une série de problèmes informatiques difficiles, et le travail des développeurs de logiciels – qui travaillent désormais autant avec les données qu'avec le code source – change fondamentalement dans le processus.

De nombreuses sociétés d'IA (et investisseurs) parient que cette relation s'étendra au-delà de la simple technologie – que les entreprises d'IA ressembleront également aux sociétés de logiciels traditionnelles. Sur la base de notre expérience de travail avec des entreprises d'IA, nous n'en sommes pas si sûrs.

Nous croyons fermement au pouvoir de l'IA de transformer les affaires: nous avons investi notre argent dans cette thèse et nous continuerons d'investir massivement dans les entreprises d'IA appliquées et l'infrastructure d'IA. Cependant, nous avons remarqué dans de nombreux cas que les entreprises d'IA n'ont tout simplement pas la même construction économique que les entreprises de logiciels. Parfois, elles peuvent même ressembler davantage à des entreprises de services traditionnels. En particulier, de nombreuses entreprises d'IA ont:

  • Marges brutes plus faibles en raison de l'utilisation intensive de l'infrastructure cloud et de l'assistance humaine continue;
  • Difficultés de mise à l'échelle dues au problème épineux des cas marginaux;
  • Des douves défensives plus faibles en raison de la marchandisation des modèles d'IA et des défis liés aux effets de réseau de données.
  • Pour l'anecdote, nous avons observé une tendance étonnamment cohérente dans les données financières des sociétés d'IA, avec des marges brutes souvent de l'ordre de 50 à 60% – bien en dessous de la référence de 60 à 80% + pour des entreprises SaaS comparables. Les capitaux privés à un stade précoce peuvent masquer ces inefficacités à court terme, d'autant plus que certains investisseurs poussent à la croissance plutôt qu'à la rentabilité. Il n'est pas clair, cependant, qu'une quelconque optimisation à long terme du produit ou de la mise sur le marché (GTM) puisse résoudre complètement le problème.

    Tout comme le SaaS a inauguré un nouveau modèle économique par rapport aux logiciels sur site, nous pensons que l'IA crée un type d'activité essentiellement nouveau. Cet article présente donc certaines des différences entre les sociétés d'intelligence artificielle et les sociétés de logiciels traditionnelles et partage quelques conseils sur la manière de remédier à ces différences. Notre objectif n'est pas d'être normatif, mais plutôt d'aider les opérateurs et autres à comprendre l'économie et le paysage stratégique de l'IA afin qu'ils puissent construire des entreprises durables.

    Logiciel + services = AI?

    La beauté des logiciels (y compris SaaS) est qu'ils peuvent être produits une fois et vendus plusieurs fois. Cette propriété crée un certain nombre d'avantages commerciaux convaincants, y compris des flux de revenus récurrents, des marges brutes élevées (60-80% +) et – dans des cas relativement rares lorsque des effets de réseau ou des effets d'échelle se manifestent – une mise à l'échelle superlinéaire. Les éditeurs de logiciels ont également le potentiel de construire de solides douves défensives car ils possèdent la propriété intellectuelle (généralement le code) générée par leur travail.

    Les entreprises de services occupent l'autre extrémité du spectre. Chaque nouveau projet nécessite des effectifs dédiés et peut être vendu une seule fois. Par conséquent, les revenus ont tendance à être non récurrents, les marges brutes sont inférieures (30 à 50%) et la mise à l'échelle est au mieux linéaire. La défensibilité est plus difficile – souvent basée sur le contrôle de la marque ou du compte titulaire – car toute propriété intellectuelle qui n'appartient pas au client est peu susceptible d'avoir une large applicabilité.

    Les entreprises d'IA semblent de plus en plus combiner des éléments à la fois de logiciels et de services.

    La plupart des applications d'IA ressemblent à des logiciels normaux. Ils s'appuient sur du code conventionnel pour effectuer des tâches telles que l'interfaçage avec les utilisateurs, la gestion des données ou l'intégration avec d'autres systèmes. Le cœur de l'application, cependant, est un ensemble de modèles de données formés. Ces modèles interprètent les images, transcrivent la parole, génèrent un langage naturel et effectuent d'autres tâches complexes. Les entretenir peut parfois ressembler davantage à une entreprise de services – nécessitant des coûts de travail et de saisie spécifiques au client, au-delà des fonctions de support et de réussite classiques.

    Cette dynamique affecte les entreprises d'IA de plusieurs manières importantes. Nous en explorons plusieurs – marges brutes, mise à l'échelle et défensibilité – dans les sections suivantes.

    Marges brutes, partie 1: l'infrastructure cloud est un coût substantiel – et parfois caché – pour les entreprises d'IA

    Dans l'ancien temps des logiciels sur site, la livraison d'un produit signifiait l'abattage et l'expédition des supports physiques – le coût de fonctionnement du logiciel, que ce soit sur des serveurs ou des ordinateurs de bureau, était supporté par l'acheteur. Aujourd'hui, avec la domination du SaaS, ce coût a été repoussé au fournisseur. La plupart des éditeurs de logiciels paient de grosses factures AWS ou Azure chaque mois – plus le logiciel est exigeant, plus la facture est élevée.

    Il s'avère que l'IA est assez exigeante:

  • La formation d'un modèle d'IA unique peut coûter des centaines de milliers de dollars (ou plus) en ressources de calcul. S'il est tentant de traiter cela comme un coût ponctuel, la reconversion est de plus en plus reconnue comme un coût permanent, car les données qui alimentent les modèles d'IA ont tendance à changer au fil du temps (un phénomène appelé «dérive des données»).
  • L'inférence de modèle (le processus de génération de prédictions en production) est également plus complexe sur le plan informatique que l'exploitation de logiciels traditionnels. L'exécution d'une longue série de multiplications matricielles nécessite simplement plus de mathématiques que, par exemple, la lecture d'une base de données.
  • Les applications d'IA sont plus susceptibles que les logiciels traditionnels de fonctionner sur des supports riches tels que des images, du son ou de la vidéo. Ces types de données consomment des ressources de stockage plus élevées que d'habitude, sont coûteux à traiter et souffrent souvent de problèmes de région d'intérêt – une application peut avoir besoin de traiter un gros fichier pour trouver un petit extrait pertinent.
  • Des sociétés d’IA nous ont dit que les opérations dans le cloud peuvent être plus complexes et coûteuses que les approches traditionnelles, en particulier parce qu’il n’existe pas de bons outils pour faire évoluer les modèles d’IA dans le monde entier. En conséquence, certaines sociétés d'IA doivent transférer régulièrement des modèles formés dans les régions du cloud – augmentant ainsi les coûts d'entrée et de sortie – pour améliorer la fiabilité, la latence et la conformité.
  • à lire :  FormulaFolio Investments LLC renforce sa participation dans Vanguard Utilit ...

    Ensemble, ces forces contribuent aux 25% ou plus des revenus que les entreprises d'IA dépensent souvent sur les ressources cloud. Dans les cas extrêmes, les startups s'attaquant à des tâches particulièrement complexes ont en fait trouvé le traitement manuel des données moins cher que l'exécution d'un modèle formé.

    L'aide arrive sous la forme de processeurs IA spécialisés qui peuvent exécuter les calculs plus efficacement et des techniques d'optimisation, telles que la compression de modèle et la compilation croisée, qui réduisent le nombre de calculs nécessaires.

    Mais on ne sait pas à quoi ressemblera la forme de la courbe d'efficacité. Dans de nombreux domaines problématiques, un traitement et des données exponentiellement plus importants sont nécessaires pour obtenir une précision progressivement accrue. Cela signifie – comme nous l'avons déjà noté – que la complexité du modèle augmente à un rythme incroyable, et il est peu probable que les processeurs puissent suivre. La loi de Moore ne suffit pas. (Par exemple, les ressources de calcul requises pour former des modèles d'IA de pointe ont augmenté de plus de 300 000 fois depuis 2012, tandis que le nombre de transistors des GPU NVIDIA n'a augmenté que de ~ 4x!) L'informatique distribuée est une solution convaincante à ce problème , mais il aborde principalement la vitesse – pas le coût.

    Marges brutes, partie 2: de nombreuses applications d'IA dépendent des «humains dans la boucle» pour fonctionner avec un haut niveau de précision

    Les systèmes humains dans la boucle prennent deux formes, qui contribuent toutes deux à réduire les marges brutes de nombreuses startups de l'IA.

    Premièrement: la formation de la plupart des modèles d'intelligence artificielle modernes implique le nettoyage manuel et l'étiquetage de grands ensembles de données. Ce processus est laborieux, coûteux et parmi les plus grands obstacles à une adoption plus répandue de l'IA. De plus, comme nous l'avons vu ci-dessus, la formation ne se termine pas une fois qu'un modèle est déployé. Pour maintenir la précision, les nouvelles données d'entraînement doivent être continuellement saisies, étiquetées et réintroduites dans le système. Bien que des techniques telles que la détection de dérive et l'apprentissage actif puissent réduire le fardeau, des données anecdotiques montrent que de nombreuses entreprises dépensent jusqu'à 10 à 15% des revenus sur ce processus – généralement sans compter les ressources d'ingénierie de base – et suggèrent que le travail de développement en cours dépasse les corrections de bogues et les fonctionnalités typiques. ajouts.

    Deuxièmement: pour de nombreuses tâches, en particulier celles nécessitant un plus grand raisonnement cognitif, les humains sont souvent connectés aux systèmes d'IA en temps réel. Les sociétés de médias sociaux, par exemple, emploient des milliers de réviseurs humains pour augmenter les systèmes de modération basés sur l'IA. De nombreux systèmes de véhicules autonomes incluent des opérateurs humains à distance, et la plupart des dispositifs médicaux basés sur l'IA s'interfacent avec les médecins en tant que décideurs conjoints. De plus en plus de startups adoptent cette approche à mesure que les capacités des systèmes d'IA modernes sont de mieux en mieux comprises. Un certain nombre de sociétés d'intelligence artificielle qui prévoyaient de vendre des produits logiciels purs apportent de plus en plus une capacité de services en interne et réservent les coûts associés.

    La nécessité d'une intervention humaine diminuera probablement à mesure que les performances des modèles d'IA s'améliorent. Il est peu probable, cependant, que les humains soient totalement exclus de la boucle. De nombreux problèmes – comme les voitures autonomes – sont trop complexes pour être entièrement automatisés avec les techniques d'IA de génération actuelle. Les questions de sécurité, d'équité et de confiance nécessitent également une surveillance humaine significative – un fait susceptible d'être inscrit dans les réglementations sur l'IA actuellement en cours d'élaboration aux États-Unis, dans l'UE et ailleurs.

    Même si, à terme, nous réalisons une automatisation complète pour certaines tâches, il n'est pas clair combien les marges s'amélioreront en conséquence. La fonction de base d'une application AI est de traiter un flux de données d'entrée et de générer des prédictions pertinentes. Le coût de fonctionnement du système est donc fonction de la quantité de données traitées. Certains points de données sont gérés par des humains (relativement coûteux), tandis que d'autres sont traités automatiquement par des modèles d'IA (espérons-le moins chers). Mais chaque entrée doit être traitée, dans un sens ou dans l'autre.

    Pour cette raison, les deux catégories de coûts dont nous avons parlé jusqu'à présent – le cloud computing et le support humain – sont en fait liées. La réduction de l'un tend à entraîner une augmentation de l'autre. Les deux éléments de l'équation peuvent être optimisés, mais aucun des deux n'atteindra probablement les niveaux de coût quasi nul associés aux entreprises SaaS.

    La mise à l'échelle des systèmes d'IA peut être plus difficile que prévu, car l'IA vit dans la longue queue

    Pour les entreprises d'IA, il est un peu plus difficile de savoir quand vous avez trouvé l'adaptation au marché des produits qu'avec les logiciels traditionnels. Il est trompeusement facile de penser que vous y êtes arrivé – en particulier après la fermeture de 5 à 10 excellents clients – seulement pour voir l'arriéré de votre équipe ML commencer à gonfler et les calendriers de déploiement des clients commencent à s'étirer de façon inquiétante, tirant les ressources des nouvelles ventes.

    Le coupable, dans de nombreuses situations, est les cas marginaux. De nombreuses applications d'IA ont des interfaces ouvertes et fonctionnent sur des données bruyantes et non structurées (comme les images ou le langage naturel). Les utilisateurs manquent souvent d'intuition autour du produit ou, pire, supposent qu'il possède des capacités humaines / surhumaines. Cela signifie que les cas extrêmes sont partout: jusqu'à 40 à 50% des fonctionnalités prévues pour les produits d'IA que nous avons examinés peuvent résider dans la longue queue de l'intention de l'utilisateur.

    Autrement dit, les utilisateurs peuvent – et vont – entrer à peu près n'importe quoi dans une application AI.

    à lire :  Les factures de services publics coûtent le plus et le moins dans ces États

    La gestion de cet immense espace d'état a tendance à être une corvée continue. Étant donné que la plage de valeurs d'entrée possibles est si grande, chaque nouveau déploiement client est susceptible de générer des données jamais vues auparavant. Même les clients qui semblent similaires – deux constructeurs automobiles faisant la détection de défauts, par exemple – peuvent avoir besoin de données de formation sensiblement différentes, en raison de quelque chose d'aussi simple que le placement de caméras vidéo sur leurs chaînes de montage.

    Un fondateur appelle ce phénomène le «coût du temps» des produits d'IA. Son entreprise gère une période dédiée de collecte de données et de mise au point des modèles au début de chaque nouvel engagement client. Cela leur donne une visibilité sur la distribution des données du client et élimine certains cas marginaux avant le déploiement. Mais cela implique également un coût: l’équipe et les ressources financières de l’entreprise sont liées jusqu’à ce que la précision du modèle atteigne un niveau acceptable. La durée de la période de formation est également généralement inconnue, car il existe généralement peu d'options pour générer des données de formation plus rapidement… quel que soit le niveau de travail de l'équipe.

    Les startups de l'IA finissent souvent par consacrer plus de temps et de ressources au déploiement de leurs produits que prévu. Il peut être difficile d'identifier ces besoins à l'avance, car les outils de prototypage traditionnels – comme les maquettes, les prototypes ou les tests bêta – ont tendance à couvrir uniquement les chemins les plus courants, pas les cas marginaux. Comme les logiciels traditionnels, le processus prend beaucoup de temps avec les premières cohortes de clients, mais contrairement aux logiciels traditionnels, il ne disparaît pas nécessairement avec le temps.

    Le manuel de jeu pour la défense des entreprises de l'IA est toujours en cours d'écriture

    Les grandes sociétés de logiciels sont construites autour de solides douves défensives. Certains des meilleurs fossés sont des forces fortes comme les effets de réseau, les coûts de commutation élevés et les économies d'échelle.

    Tous ces facteurs sont également possibles pour les entreprises d'IA. Le fondement de la défensibilité est généralement formé, bien que – en particulier dans l'entreprise – par un produit techniquement supérieur. Être le premier à mettre en œuvre un logiciel complexe peut apporter des avantages majeurs à la marque et des périodes de quasi-exclusivité.

    Dans le monde de l'IA, la différenciation technique est plus difficile à réaliser. De nouvelles architectures modèles sont développées principalement dans des environnements académiques ouverts. Les implémentations de référence (modèles pré-formés) sont disponibles à partir de bibliothèques open-source et les paramètres du modèle peuvent être optimisés automatiquement. Les données sont au cœur d'un système d'IA, mais elles appartiennent souvent à des clients, dans le domaine public, ou au fil du temps deviennent une marchandise. Il a également une valeur décroissante à mesure que les marchés mûrissent et montre des effets de réseau relativement faibles. Dans certains cas, nous avons même constaté des déséconomies d'échelle associées aux données alimentant les entreprises d'IA. Au fur et à mesure que les modèles deviennent plus matures – comme le soutient «La promesse vide de fossés de données» – chaque nouveau cas de pointe devient de plus en plus coûteux à traiter, tout en offrant de la valeur à de moins en moins de clients pertinents.

    Cela ne signifie pas nécessairement que les produits d'IA sont moins défendables que leurs homologues purement logiciels. Mais les fossés pour les entreprises d'IA semblent être moins profonds que beaucoup ne le pensaient. L'IA peut être en grande partie une transmission, du point de vue de la défensibilité, au produit et aux données sous-jacents.

    Créer, faire évoluer et défendre de grandes entreprises d'IA – conseils pratiques pour les fondateurs

    Nous pensons que la clé du succès à long terme pour les entreprises d'IA est de maîtriser les défis et de combiner le meilleur des services et des logiciels. Dans cet esprit, voici un certain nombre de mesures que les fondateurs peuvent prendre pour prospérer avec des applications d'IA nouvelles ou existantes.

    Éliminez autant que possible la complexité du modèle. Nous avons constaté une énorme différence de COGS entre les startups qui forment un modèle unique par client et celles qui sont en mesure de partager un seul modèle (ou ensemble de modèles) entre tous les clients. La stratégie du «modèle unique» est plus facile à maintenir, plus rapide à déployer auprès de nouveaux clients et prend en charge une organisation d'ingénierie plus simple et plus efficace. Cela a également tendance à réduire l'étalement du pipeline de données et les cycles de formation en double, ce qui peut considérablement améliorer les coûts d'infrastructure cloud. Bien qu'il n'y ait pas de solution miracle pour atteindre cet état idéal, l'une des clés est de comprendre autant que possible vos clients – et leurs données – avant d'accepter un accord. Parfois, il est évident qu'un nouveau client entraînera une fourchette majeure dans vos efforts d'ingénierie ML. La plupart du temps, les changements sont plus subtils, impliquant seulement quelques modèles uniques ou quelques réglages fins. Faire ces appels au jugement – compromis entre la santé économique à long terme et la croissance à court terme – est l'un des emplois les plus importants auxquels les fondateurs de l'IA doivent faire face.

    Choisissez les domaines problématiques avec soin – et souvent de manière étroite – pour réduire la complexité des données. L'automatisation du travail humain est une chose fondamentalement difficile à faire. De nombreuses entreprises constatent que la tâche minimale viable pour les modèles d'IA est plus étroite que prévu. Plutôt que de proposer des suggestions générales de texte, par exemple, certaines équipes ont réussi à proposer de courtes suggestions dans des courriers électroniques ou des offres d'emploi. Les entreprises travaillant dans l'espace CRM ont trouvé des niches très utiles pour l'IA basées uniquement sur la mise à jour des enregistrements. Il existe une grande classe de problèmes, comme ceux-ci, difficiles à réaliser pour les humains mais relativement faciles pour l'IA. Ils impliquent généralement des tâches de grande envergure et de faible complexité, telles que la modération, la saisie / codage de données, la transcription, etc. La concentration sur ces domaines peut minimiser le défi des cas marginaux persistants – en d'autres termes, ils peuvent simplifier les données alimentant le Processus de développement de l'IA.

    Prévoyez des coûts variables élevés. En tant que fondateur, vous devez disposer d'un cadre mental fiable et intuitif pour votre modèle d'entreprise. Les coûts discutés dans cet article vont probablement s'améliorer – réduits d'une certaine constante – mais ce serait une erreur de supposer qu'ils disparaîtront complètement (ou de forcer cela de manière anormale). Au lieu de cela, nous suggérons de construire un modèle commercial et une stratégie GTM avec des marges brutes plus faibles à l'esprit. Quelques bons conseils des fondateurs: Comprenez en profondeur la distribution des données alimentant vos modèles. Traitez la maintenance des modèles et le basculement humain comme des problèmes de premier ordre. Suivez et mesurez vos coûts variables réels – ne les laissez pas se cacher dans la R&D. Faites des hypothèses économiques unitaires prudentes dans vos modèles financiers, en particulier lors d'une levée de fonds. N'attendez pas l'échelle ou les avancées technologiques extérieures pour résoudre le problème.

    à lire :  Travail a domicile seine et marne | Créer son entreprise

    Embrassez les services. Il existe d'énormes possibilités de rencontrer le marché où il se trouve. Cela peut signifier offrir un service de traduction complet plutôt qu'un logiciel de traduction ou gérer un service de taxi plutôt que de vendre des voitures autonomes. Construire des entreprises hybrides est plus difficile que des logiciels purs, mais cette approche peut fournir un aperçu approfondi des besoins des clients et générer des entreprises à croissance rapide et définissant le marché. Les services peuvent également être un excellent outil pour lancer le moteur de mise sur le marché d'une entreprise – consultez cet article pour en savoir plus – en particulier lors de la vente de technologies complexes et / ou flambant neuves. La clé est de poursuivre une stratégie de manière engagée, plutôt que de soutenir les clients des logiciels et des services.

    Planifiez des changements dans la pile technologique. L'IA moderne en est encore à ses balbutiements. Les outils qui aident les praticiens à faire leur travail de manière efficace et standardisée sont en cours de construction. Au cours des prochaines années, nous prévoyons une disponibilité généralisée d'outils pour automatiser la formation des modèles, rendre l'inférence plus efficace, standardiser les flux de travail des développeurs et surveiller et sécuriser les modèles d'IA en production. Le cloud computing, en général, gagne également plus d'attention en tant que problème de coût à résoudre par les éditeurs de logiciels. Le fait de coupler étroitement une application à la manière actuelle de faire les choses peut conduire à un inconvénient architectural à l'avenir.

    Renforcez la défensibilité à l'ancienne. Bien qu'il ne soit pas clair si un modèle d'IA lui-même – ou les données sous-jacentes – fournira un fossé à long terme, de bons produits et des données propriétaires créent presque toujours de bonnes entreprises. L'IA donne aux fondateurs un nouvel angle sur les anciens problèmes. Les techniques d'IA, par exemple, ont apporté une nouvelle valeur sur le marché de la détection de logiciels malveillants relativement endormi en affichant simplement de meilleures performances. L'occasion de créer des produits collants et des entreprises durables en plus des capacités initiales et uniques du produit est toujours d'actualité. Fait intéressant, nous avons également vu plusieurs sociétés d'intelligence artificielle consolider leur position sur le marché grâce à une stratégie cloud efficace, similaire à la génération la plus récente de sociétés open source.

    * * *

    Pour résumer: la plupart des systèmes d’IA ne sont pas tout à fait des logiciels au sens traditionnel du terme. Et les entreprises d'IA, par conséquent, ne ressemblent pas exactement aux entreprises de logiciels. Ils impliquent un soutien humain continu et des coûts variables matériels. Souvent, ils ne s’adaptent pas aussi facilement que nous le souhaiterions. Et une forte défensibilité – essentielle au modèle de logiciel «construire une fois / vendre plusieurs fois» – ne semble pas venir gratuitement.

    Ces traits font que l'IA se sent, dans une certaine mesure, comme une entreprise de services. Autrement dit: vous pouvez remplacer la société de services, mais vous ne pouvez pas (complètement) remplacer les services.

    Croyez-le ou non, cela peut être une bonne nouvelle. Des choses comme les coûts variables, la dynamique de mise à l'échelle et les douves défensives sont finalement déterminées par les marchés – pas par les entreprises individuelles. Le fait que nous constatons des tendances inconnues dans les données suggère que les entreprises d'IA sont vraiment quelque chose de nouveau – pénétrant de nouveaux marchés et créant d'énormes opportunités. Il existe déjà un certain nombre de grandes sociétés d'intelligence artificielle qui ont réussi à naviguer dans le labyrinthe d'idées et à créer des produits avec des performances constamment élevées.

    L'IA est encore au début de la transition du sujet de recherche à la technologie de production. Il est facile d’oublier qu’AlexNet, qui a sans doute lancé la vague actuelle de développement de logiciels d’IA, a été publié il y a moins de huit ans. Les applications intelligentes font avancer l'industrie du logiciel et nous sommes ravis de voir où elles iront ensuite.

    Sources: Les estimations de la marge brute pour les logiciels traditionnels étaient basées sur une sélection de sociétés cotées sur publiccomps.com; les estimations de la marge brute des sociétés de services étaient basées sur 10 000 dépôts; et les estimations de la marge brute des entreprises d'IA étaient basées sur plusieurs entretiens avec les fondateurs de startups d'IA.

    Martin Casado est associé commandité de la société de capital-risque Andreessen Horowitz, où il se concentre sur l'investissement dans les entreprises.

    Matt Bornstein est associé chez Andreessen Horowitz au sein de l'équipe de gestion d'entreprise.

    Cette histoire est apparue à l'origine sur A16z.com. Copyright 2020

    Pourquoi les entreprises d'IA ne évoluent pas toujours comme les logiciels traditionnels …
    4.9 (98%) 32 votes
     

    Julien