types machine learning
convertisseur simple gratuit de youtube en mp3
Ce didacticiel explique les types d'apprentissage automatique, c'est-à-dire l'apprentissage supervisé, non supervisé, renforcé et semi-supervisé avec des exemples simples. Vous apprendrez également les différences entre l'apprentissage supervisé et non supervisé:
Dans le Tutoriel précédent , nous avons découvert le Machine Learning, son fonctionnement et ses applications. Nous avons également vu une comparaison entre l'apprentissage automatique et l'intelligence artificielle.
L'apprentissage automatique est un domaine scientifique qui traite de l'apprentissage des programmes informatiques par l'expérience et de la prédiction de la sortie.
La principale caractéristique du ML est d'apprendre de l'expérience. L'apprentissage se produit lorsque le système alimenté en données d'entrée d'apprentissage modifie ses paramètres et s'ajuste pour donner la sortie souhaitée. La sortie est la valeur cible définie dans les données d'entraînement.
=> Lisez la série complète de formations sur l'apprentissage automatique
Ce que vous apprendrez:
- Types d'apprentissage automatique
- Exemple réel d'apprentissage supervisé et non supervisé
- Différence entre l'apprentissage supervisé et l'apprentissage non supervisé
- Apprentissage semi-supervisé
- Conclusion
Types d'apprentissage automatique
Les programmes d'apprentissage automatique sont classés en 3 types, comme indiqué ci-dessous.
- Supervisé
- Non supervisé
- Apprentissage par renforcement
Comprenons chacun d'eux en détail !!
# 1) Apprentissage supervisé
L'apprentissage supervisé se fait en présence d'un superviseur tout comme l'apprentissage effectué par un petit enfant avec l'aide de son professeur. Comme un enfant est formé à reconnaître les fruits, les couleurs, les nombres sous la supervision d'un enseignant, cette méthode est un apprentissage supervisé.
Dans cette méthode, chaque étape de l'enfant est vérifiée par l'enseignant et l'enfant apprend de la sortie qu'il doit produire.
Comment fonctionne l'apprentissage supervisé?
Dans l'algorithme ML supervisé, la sortie est déjà connue. Il y a un mappage de l'entrée avec la sortie. Par conséquent, pour créer un modèle, la machine est alimentée avec de nombreuses données d'entrée d'entraînement (dont l'entrée et la sortie correspondante sont connues).
Les données d'entraînement aident à atteindre un niveau de précision pour le modèle de données créé. Le modèle construit est maintenant prêt à recevoir de nouvelles données d'entrée et à prévoir les résultats.
Qu'est-ce qu'un jeu de données étiqueté?
L'ensemble de données avec des sorties connues pour une entrée donnée est appelé un ensemble de données étiqueté. Par exemple, une image de fruit avec le nom du fruit est connue. Ainsi, lorsqu'une nouvelle image de fruit est affichée, elle se compare à l'ensemble d'entraînement pour prédire la réponse.
L'apprentissage supervisé est un mécanisme d'apprentissage rapide avec une grande précision. Les problèmes d'apprentissage supervisé comprennent des problèmes de régression et de classification.
Certains des algorithmes d'apprentissage supervisé sont:
- Arbres de décision,
- K-voisin le plus proche,
- Régression linéaire,
- Support Vector Machine et
- Les réseaux de neurones.
Exemple d'apprentissage supervisé
- Dans la première étape, un ensemble de données d'apprentissage est transmis à l'algorithme d'apprentissage automatique.
- Avec le jeu de données d'entraînement, la machine s'ajuste d'elle-même, en modifiant les paramètres pour créer un modèle logique.
- Le modèle construit est ensuite utilisé pour un nouvel ensemble de données afin de prédire le résultat.
Types d'algorithmes d'apprentissage supervisé
- Classification: Dans ces types de problèmes, nous prédisons la réponse sous forme de classes spécifiques, telles que «oui» ou «non». Lorsque seulement 2 classes sont présentes, cela s'appelle une classification binaire. Pour plus de 2 valeurs de classe, cela s'appelle une classification multi-classes. Les valeurs de réponse prédites sont des valeurs discrètes. Par exemple, Est-ce l'image du soleil ou de la lune? L'algorithme de classification sépare les données en classes.
- Régression: Les problèmes de régression prédisent la réponse sous forme de valeurs continues telles que la prédiction d'une valeur comprise entre -infini et l'infini. Cela peut prendre plusieurs valeurs. Par exemple, l'algorithme de régression linéaire qui est appliqué, prédit le coût de la maison en fonction de nombreux paramètres tels que l'emplacement, l'aéroport à proximité, la taille de la maison, etc.
# 2) Apprentissage non supervisé
L'apprentissage non supervisé se produit sans l'aide d'un superviseur, tout comme un poisson apprend à nager par lui-même. C'est un processus d'apprentissage indépendant.
Dans ce modèle, comme il n'y a pas de sortie mappée avec l'entrée, les valeurs cibles sont inconnues / non étiquetées. Le système doit apprendre par lui-même à partir de l'entrée de données et détecter les modèles cachés.
Qu'est-ce qu'un jeu de données sans étiquette?
Un ensemble de données avec des valeurs de sortie inconnues pour toutes les valeurs d'entrée est appelé un ensemble de données sans étiquette.
Comment fonctionne l'apprentissage non supervisé?
Comme il n'y a pas de valeurs de sortie connues pouvant être utilisées pour créer un modèle logique entre l'entrée et la sortie, certaines techniques sont utilisées pour extraire des règles de données, des modèles et des groupes de données de types similaires. Ces groupes aident les utilisateurs finaux à mieux comprendre les données et à trouver une sortie significative.
Les entrées alimentées ne sont pas sous la forme d'une structure appropriée, tout comme les données d'apprentissage (dans l'apprentissage supervisé). Il peut contenir des valeurs aberrantes, des données bruyantes, etc. Ces entrées sont ensemble transmises au système. Lors de la formation du modèle, les entrées sont organisées pour former des clusters.
Les algorithmes d'apprentissage non supervisé incluent des algorithmes de clustering et d'association tels que:
- A priori,
- K-signifie clustering et autres algorithmes d'exploration de règles d'association.
Lorsque de nouvelles données sont transmises au modèle, elles prédisent le résultat sous la forme d'une étiquette de classe à laquelle appartient l'entrée. Si l'étiquette de classe n'est pas présente, une nouvelle classe sera générée.
Tout en subissant le processus de découverte de modèles dans les données, le modèle ajuste ses paramètres par lui-même, il est donc également appelé auto-organisé. Les grappes seront formées en découvrant les similitudes entre les entrées.
Par exemple, lors de l'achat de produits en ligne, si le beurre est mis dans le panier, il suggère d'acheter du pain, du fromage, etc. Le modèle non supervisé examine les points de données et prédit les autres attributs associés au produit.
Exemple d'apprentissage non supervisé
Types d'algorithmes non supervisés
- Algorithme de clustering : Les méthodes permettant de trouver les similitudes entre les éléments de données tels que la même forme, la même taille, la même couleur, le même prix, etc. et de les regrouper pour former un cluster est l'analyse de cluster.
- Détection des valeurs aberrantes : Dans cette méthode, l'ensemble de données est la recherche de tout type de dissemblances et d'anomalies dans les données. Par exemple, une transaction de grande valeur sur carte de crédit est détectée par le système de détection de fraude.
- Extraction de règles d'association : Dans ce type d'extraction, il détecte les jeux d'éléments ou associations entre éléments les plus fréquents. Des associations telles que «les produits souvent achetés ensemble», etc.
- Auto-encodeurs: L'entrée est compressée sous une forme codée et est recréée pour supprimer les données bruyantes. Cette technique est utilisée pour améliorer la qualité de l'image et de la vidéo.
# 3) Apprentissage par renforcement
Dans ce type d'apprentissage, l'algorithme apprend par un mécanisme de rétroaction et des expériences passées. Il est toujours souhaitable que chaque étape de l'algorithme soit effectuée pour atteindre un objectif.
Ainsi, chaque fois que la prochaine étape doit être franchie, il reçoit les commentaires de l'étape précédente, ainsi que l'apprentissage de l'expérience pour prédire quelle pourrait être la meilleure étape suivante. Ce processus est également appelé un processus d'essai et d'erreur pour atteindre l'objectif.
L'apprentissage par renforcement est un processus itératif à long terme. Plus le nombre de retours est élevé, plus le système devient précis. L'apprentissage de base par renforcement est également appelé processus de décision de Markov.
Exemple d'apprentissage par renforcement
Les jeux vidéo sont un exemple d'apprentissage par renforcement, où les joueurs terminent certains niveaux d'un jeu et gagnent des points de récompense. Le jeu fournit une rétroaction au joueur par le biais de mouvements bonus pour améliorer ses performances.
L'apprentissage par renforcement est utilisé dans la formation de robots, de voitures autonomes, de gestion automatique des stocks, etc.
Certains algorithmes populaires d'apprentissage par renforcement comprennent:
- Q-Learning,
- Réseaux opposés profonds
- Différence temporelle
La figure ci-dessous décrit le mécanisme de rétroaction de l'apprentissage par renforcement.
comment ouvrir le fichier .jar
- L'entrée est observée par l'agent qui est l'élément AI.
- Cet agent IA agit sur l'environnement selon la décision prise.
- La réponse de l'environnement est envoyée à l'IA sous la forme d'une récompense en retour en retour.
- L'état et l'action exécutés sur l'environnement sont également enregistrés.
(image la source )
Exemple réel d'apprentissage supervisé et non supervisé
Pour l'apprentissage supervisé:
#1) Prenons un exemple de panier de légumes avec oignon, carotte, radis, tomate, etc., et nous pouvons les organiser sous forme de groupes.
#deux) Nous créons un tableau de données de formation pour comprendre l'apprentissage supervisé.
Le tableau de données d'entraînement caractérise les légumes en fonction:
- Façonner
- Couleur
- Taille
Façonner | Couleur | Taille | Légume |
---|---|---|---|
Il est plus précis que l'apprentissage non supervisé car les données d'entrée et la sortie correspondante sont bien connues, et la machine n'a besoin que de donner des prédictions. | Il a moins de précision car les données d'entrée ne sont pas étiquetées. Ainsi, la machine doit d'abord comprendre et étiqueter les données, puis donner des prédictions. | ||
Rond | marron | Gros | Oignon |
Rond | Rapporter | Moyen | Tomate |
Cylindrique | blanc | Gros | Un radis |
Cylindrique | Rapporter | Moyen | Carotte |
Lorsque cette table de données d'entraînement est envoyée à la machine, celle-ci construira un modèle logique utilisant la forme, la couleur, la taille du légume, etc., pour prédire le résultat (légume).
Lorsqu'une nouvelle entrée est fournie à ce modèle, l'algorithme analysera les paramètres et affichera le nom du fruit.
Pour l'apprentissage non supervisé:
Dans l'apprentissage non supervisé, il crée des groupes ou des clusters basés sur des attributs. Dans l'exemple de jeu de données ci-dessus, les paramètres de légume sont:
# 1) Forme
Les légumes sont regroupés en fonction de leur forme.
- Rond: Oignon et tomate.
- Cylindrique: Radis et carotte.
Prenez un autre paramètre tel que la taille.
# 2) Taille
Les légumes sont regroupés en fonction de leur taille et de leur forme:
- Taille moyenne et forme ronde: Tomate
- Grande taille et forme ronde: Oignon
Dans l'apprentissage non supervisé, nous n'avons pas de jeu de données d'entraînement et de variable de résultat tandis que dans l'apprentissage supervisé, les données d'entraînement sont connues et sont utilisées pour entraîner l'algorithme.
Différence entre l'apprentissage supervisé et l'apprentissage non supervisé
Supervisé | Non supervisé |
---|---|
Dans les algorithmes d'apprentissage supervisé, la sortie pour l'entrée donnée est connue. | Dans les algorithmes d'apprentissage non supervisé, la sortie pour l'entrée donnée est inconnue. |
Les algorithmes apprennent à partir d'un ensemble étiqueté de données. Ces données aident à évaluer l'exactitude des données d'entraînement. | L'algorithme est fourni avec des données non étiquetées où il essaie de trouver des modèles et des associations entre les éléments de données. |
Il s'agit d'une technique de modélisation prédictive qui prédit avec précision les résultats futurs. | Il s'agit d'une technique de modélisation descriptive qui explique la relation réelle entre les éléments et l'histoire des éléments. |
Il comprend des algorithmes de classification et de régression. | Il comprend des algorithmes d'apprentissage des règles de clustering et d'association. |
Certains algorithmes d'apprentissage supervisé sont la régression linéaire, les bayes naïves et les réseaux de neurones. | Certains algorithmes d'apprentissage non supervisé sont le clustering k-means, Apriori, etc. |
Ce type d'apprentissage est relativement complexe car il nécessite des données étiquetées. | C'est moins complexe car il n'est pas nécessaire de comprendre et d'étiqueter les données. |
Il s'agit d'un processus d'analyse de données en ligne et ne nécessite aucune interaction humaine. | Il s'agit d'une analyse en temps réel des données. |
Apprentissage semi-supervisé
L'approche d'apprentissage semi-supervisé prend à la fois des entrées de données de formation étiquetées et non étiquetées. Ce type d'apprentissage est utile lorsqu'il est difficile d'extraire des caractéristiques utiles de données non étiquetées (approche supervisée) et que les experts en données ont du mal à étiqueter les données d'entrée (approche non supervisée).
sql requêtes questions et réponses pdf
Seule une petite quantité de données étiquetées dans ces algorithmes peut conduire à la précision du modèle.
Exemples des apprentissages semi-supervisés comprennent les tomodensitogrammes et les IRM où un expert médical peut identifier quelques points dans les scans pour n'importe quelle maladie alors qu'il est difficile d'étiqueter tous les scans.
Conclusion
Les tâches d'apprentissage automatique sont généralement classées en tâches d'apprentissage supervisé, non supervisé, semi-supervisé et par renforcement.
L'apprentissage supervisé consiste à apprendre à l'aide de données étiquetées. Les algorithmes ML sont alimentés par un ensemble de données d'entraînement dans lequel pour chaque donnée d'entrée la sortie est connue, pour prédire les résultats futurs.
Ce modèle est très précis et rapide, mais sa construction nécessite une grande expertise et du temps. En outre, ces modèles nécessitent une reconstruction si les données changent. Les tâches de ML telles que la régression et la classification sont effectuées dans un environnement d'apprentissage supervisé.
L'apprentissage non supervisé a lieu sans l'aide d'un superviseur. Les données d'entrée fournies aux algorithmes ML ne sont pas étiquetées, c'est-à-dire que pour chaque entrée, aucune sortie n'est connue. L'algorithme découvre par lui-même les tendances et le modèle dans les données d'entrée et crée une association entre les différents attributs de l'entrée.
Ce type d'apprentissage est utile pour trouver des modèles dans les données, créer des grappes de données et analyser en temps réel. Des tâches telles que le clustering, les algorithmes KNN, etc., relèvent d'un apprentissage non supervisé.
Les tâches d'apprentissage semi-supervisées bénéficient à la fois d'algorithmes supervisés et non supervisés en prédisant les résultats à l'aide de données étiquetées et non étiquetées. L'apprentissage par renforcement est un type de mécanisme de rétroaction dans lequel la machine apprend à partir des commentaires constants de l'environnement pour atteindre son objectif.
Dans ce type d'apprentissage, les agents IA exécutent certaines actions sur les données et l'environnement donne une récompense. L'apprentissage par renforcement est utilisé par les jeux multijoueurs pour enfants, les voitures autonomes, etc.
Restez à l'écoute de notre prochain tutoriel pour en savoir plus sur l'apprentissage automatique et le réseau de neurones artificiels!
=> Visitez ici pour la série exclusive d'apprentissage automatique
lecture recommandée
- Exploration de données Vs Machine Learning Vs Intelligence Artificielle Vs Deep Learning
- 11 outils logiciels d'apprentissage automatique les plus populaires en 2021
- Tutoriel d'apprentissage automatique: Introduction au ML et à ses applications
- Types de données Python
- Types de données C ++
- Types de risques dans les projets logiciels
- Types de tests de migration: avec des scénarios de test pour chaque type
- 15 meilleurs systèmes de gestion de l'apprentissage (LMS de l'année 2021)