L’apprentissage automatique et l’intelligence artificielle visent à développer l’informatique algorithmes, à améliorer avec l’expérience. Ces algorithmes ont le potentiel d’être utilisés pour faciliter l’analyse d’ensembles de données massifs, y compris les données de séquençage du génome.
Méthodes d’apprentissage automatique
Les méthodes d’apprentissage automatique se déroulent en plusieurs étapes. Un algorithme est développé et doté d’une large collection de données. Les données incluent des résultats négatifs et positifs afin que l’algorithme puisse apprendre à les distinguer. Les résultats sont appelés étiquettes, et l’algorithme les traite et les stocke comme modèle. Enfin, de nouvelles données non étiquetées sont transmises à l’algorithme et celui-ci utilise le modèle pour prédire les étiquettes du nouvel ensemble de données. Cette méthode est appelée enseignement supervisé et peut être utilisé pour voir si un algorithme peut apprendre à reconnaître une valeur particulière à partir d’un ensemble de données.
Les méthodes de formation sans surveillance ne fournissez pas à l’algorithme des exemples étiquetés pour faciliter la formation, mais donnez plutôt à l’algorithme des données brutes dans l’espoir qu’il puisse trouver une structure dans l’ensemble.
Applications de l’apprentissage automatique en génétique
Les algorithmes d’apprentissage automatique peuvent être utilisés pour analyser de grands ensembles de données de séquençage du génome. Les méthodes d’apprentissage supervisé pour l’identification des gènes nécessitent la saisie de séquences d’ADN marquées qui spécifier l’emplacement de début et de fin d’un gène.
L’algorithme utilise ce modèle pour apprendre les propriétés générales des gènes, tels que les modèles de séquençage de l’ADN et l’emplacement des codons d’arrêt (une séquence de trois nucléotides dans l’ADN ou l’ARN messager qui signale à la cellule d’arrêter la synthèse des protéines). Après la formation, le modèle peut utiliser ces propriétés apprises pour identifier des gènes supplémentaires à partir de nouveaux ensembles de données qui ressemblent aux gènes de l’ensemble de formation.
Perspectives et avenir de l’apprentissage automatique en génétique
L’apprentissage automatique est un sujet très complexe et vaste. Des algorithmes peuvent être créés avec lui qui permettent beaucoup analyse des données plus précise que beaucoup d’autres méthodes qui existent. La méthode d’apprentissage automatique utilisée dépend de la nature des données disponibles et de ce que les chercheurs tentent de découvrir. Des recherches plus poussées sur l’apprentissage automatique et l’intelligence artificielle fourniraient à l’avenir des méthodes plus précises d’analyse des données génétiques, conduisant ainsi à davantage de découvertes.
Les références:
1. Nature. Applications de l’apprentissage automatique en génétique et génomique
2. Cellule. Apprentissage automatique supervisé pour la génétique des populations : un nouveau paradigme
3. Accueil de l’Institut national de recherche sur le génome humain (NHGRI). Intelligence artificielle, apprentissage automatique et génomique