top 64 informatica interview questions with answers
Questions et réponses d'entretien Informatica les plus fréquemment posées:
Cet article couvre les principales questions concernant Informatica MDM, PowerCenter, Data Quality, Cloud, ETL, Admin, Testing et Developer.
Dans le scénario d’aujourd’hui, INFORMATICA a atteint l’étiquette du produit le plus exigeant à travers le monde. Ses produits ont été nouvellement introduits mais ils sont devenus populaires en peu de temps.
Au fil des ans, INFORMATICA a agi en tant que leader dans le domaine de la technologie, l'intégration de données. Basé sur l'architecture ETL (Extract, Transfer, Load), cet outil d'intégration de données propose plusieurs produits axés sur la fourniture de services aux organisations gouvernementales, aux sociétés financières et d'assurance, aux soins de santé et à plusieurs autres entreprises.
Eh bien, ce n'était que l'arrière-plan d'INFORMATICA. Mais aujourd'hui, le domaine de l'entreposage de données connaît une croissance considérable et de nombreuses opportunités d'emploi sont donc disponibles dans l'industrie.
Questions et réponses sur les entretiens avec Best Informatica
Vous trouverez ci-dessous une liste des questions et réponses d'entrevue les plus fréquemment posées. Il comprend environ 64 questions, qui, à leur tour, vous permettraient de brosser vos connaissances sur les concepts Informatica d'une manière plus simple.
Q # 1) Qu'est-ce qu'INFORMATICA? Pourquoi en avons-nous besoin?
Répondre: INFORMATICA est une société de développement de logiciels qui propose une solution d'intégration de données pour ETL, virtualisation de données, gestion des données de base, qualité des données, réplique de données, ultra messagerie, etc.
Certains des produits INFORMATICA populaires sont:
- IT PowerCenter
- INFORMATICA PowerConnect
- INFORMATIQUE Power Mart
- Échange d'énergie INFORMATICA
- Analyse de puissance INFORMATICA
- INFORMATICA Power Quality
Nous avons besoin d'INFORMATICA lorsque nous travaillons avec des systèmes de données contenant des données pour effectuer certaines opérations avec un ensemble de règles. Il facilite le nettoyage des lignes d'opérations et la modification des données des systèmes de données structurés et non structurés.
Q # 2) Quel est le format des objets INFORMATICA dans un référentiel? Quelles sont les bases de données qu'il peut connecter à Windows?
Répondre: Les objets INFORMATICA peuvent être écrits au format XML.
Voici la liste des bases de données auxquelles il peut se connecter:
- serveur SQL
- Oracle
- MS Access
- MS Excel
- DB2
- Sybase
- Teradata
Q # 3) Qu'est-ce que INFORMATICA PowerCenter?
Répondre: C'est un outil ETL / Data Integration qui est utilisé pour connecter et récupérer des données à partir de différentes sources et traitement de données. PowerCenter traite un volume élevé de données et prend en charge la récupération de données à partir de sources ERP telles que SAP, PeopleSoft, etc.
Vous pouvez connecter PowerCenter à des systèmes de gestion de base de données comme SQL et Oracle pour intégrer des données dans le troisième système.
Q # 4) Quelles sont les différentes éditions d'INFORMATICA PowerCenter disponibles?
Réponse: Les différentes éditions d'INFORMATICA PowerCenter sont:
- édition standard
- Édition avancée
- Édition Premium
La version actuelle de PowerCenter disponible est la v10 avec une augmentation de haute performance.
Q # 5) Comment pouvez-vous différencier PowerCenter et Power Map?
Réponse: Vous trouverez ci-dessous les différences entre PowerCenter et Power Map.
IT PowerCenter | Informatique PowerMart | ||
---|---|---|---|
5858 | 4566 | 3550 | 23/01/2016 |
1. | Traite un volume élevé de données | Traite un faible volume de données | |
deux. | Prend en charge les référentiels mondiaux et locaux | Prend en charge uniquement les référentiels locaux | |
3. | Prend en charge la récupération de données depuis l'ERP Des sources comme SAP, PeopleSoft, etc. | Ne prend pas en charge la récupération de données à partir de sources ERP | |
Quatre. | Convertit les référentiels locaux en référentiels globaux | Ne convertissez pas les référentiels locaux en référentiels globaux |
Q # 6) Quels sont les différents composants de PowerCenter?
Réponse: Voici les 7 composants importants de PowerCenter:
- Service PowerCenter
- Clients PowerCenter
- Référentiel PowerCenter
- Domaine PowerCenter
- Service de référentiel
- Service d'intégration
- Console d'administration PowerCenter
- Hub de services Web
Q # 7) Quels sont les différents clients de PowerCenter?
Réponse: Voici la liste des clients PowerCenter:
- Concepteur PowerCenter
- Moniteur de flux de travail PowerCenter
- Gestionnaire de flux de travail PowerCenter
- Gestionnaire de référentiel PowerCenter
Q # 8) Qu'est-ce que le référentiel INFORMATICA PowerCenter?
Répondre: Le référentiel PowerCenter est une base de données relationnelle ou une base de données système contenant des métadonnées telles que,
- Définition de la source
- Définition de la cible
- Journaux de session et de session
- Flux de travail
- Connexion ODBC
- Cartographie
Il existe deux types de référentiels:
- Dépôts globaux
- Dépôts locaux
Le référentiel PowerCenter est requis pour effectuer l'extraction, la transformation et le chargement (ETL) en fonction des métadonnées.
Q # 9) Comment élaborer le niveau de suivi?
Répondre: Le niveau de suivi peut être défini comme la quantité d'informations que le serveur écrit dans le fichier journal. Le niveau de suivi est créé et configuré soit au niveau de la transformation, soit au niveau de la session, aux deux niveaux.
Voici les 4 types de niveau de traçage:
- Aucun
- Laconique
- Initialisation détaillée
- Données détaillées
Q # 10) Comment élaborer le service d'intégration PowerCenter?
Répondre: Les services d'intégration contrôlent le flux de travail et l'exécution des processus PowerCenter.
Il existe trois composants des services d'intégration INFORMATICA, comme illustré dans la figure ci-dessous.
Processus du service d'intégration: Il est appelé pmserver, le service d'intégration peut démarrer plusieurs processus pour surveiller le flux de travail.
L'équilibrage de charge: L'équilibrage de charge fait référence à la distribution de l'ensemble de la charge de travail sur plusieurs nœuds de la grille. Un équilibreur de charge effectue différentes tâches qui incluent des commandes, des sessions, etc.
Gestionnaire de transformation de données (DTM): Data Transformation Manager permet d'effectuer les transformations de données suivantes:
- Actif: Pour modifier le nombre de lignes dans la sortie.
- Passif: Impossible de modifier le nombre de lignes dans la sortie.
- Lié: Lien vers l'autre transformation.
- Sans rapport: Pas de lien avec d'autres transformations.
Q # 11) Qu'est-ce que PowerCenter on Grid?
Répondre: INFORMATICA a la fonction de Grid computing qui peut être utilisé pour la plus grande évolutivité des données afin de la performance. La fonction de grille est utilisée pour l'équilibrage de charge et le traitement parallèle.
Les domaines PowerCenter contiennent un ensemble de plusieurs nœuds pour configurer la charge de travail, puis l'exécuter sur la grille.
À domaine est la base d'une administration efficace des services servie par PowerCenter.
Nœud est une machine physique indépendante qui est représentée logiquement pour exécuter l'environnement PowerCenter.
Q # 12) Qu'est-ce que l'entreposage de données d'entreprise?
Répondre: Lorsqu'une grande quantité de données est assemblée sur un seul point d'accès, cela s'appelle Entreposage de données d'entreprise. Ces données peuvent être réutilisées et analysées à intervalles réguliers ou selon les besoins de l'exigence de temps.
Considéré comme la base de données centrale ou disons un point d'accès unique, l'entreposage de données d'entreprise offre une vue globale complète et aide ainsi à l'aide à la décision.
Il peut être mieux compris à partir des points suivants qui définissent ses caractéristiques:
- Toutes les informations commerciales importantes stockées dans cette base de données unifiée sont accessibles de n'importe où dans l'organisation.
- Bien que le temps requis soit plus long, une analyse périodique sur cette source unique produit toujours de meilleurs résultats.
- La sécurité et l'intégrité des données ne sont jamais compromises tout en les rendant accessibles dans toute l'organisation.
Q # 13) Quel est l'avantage du partitionnement de session?
Répondre: Pendant que le service d'intégration s'exécute dans l'environnement, le flux de travail est partitionné pour de meilleures performances. Ces partitions sont ensuite utilisées pour effectuer l'extraction, la transformation et le chargement.
Q # 14) Comment pouvons-nous créer un index une fois le processus de chargement terminé?
Répondre: Les tâches de commande sont utilisées pour créer un index. Les scripts de tâche de commande peuvent être utilisés dans une session du flux de travail pour créer un index.
Q # 15) Que sont les sessions?
Répondre: La session est un ensemble d'instructions utilisées lors du déplacement des données de la source vers la destination. Nous pouvons partitionner la session pour implémenter plusieurs séquences de sessions afin d'améliorer les performances du serveur.
Après avoir créé une session, nous pouvons utiliser le gestionnaire de serveur ou le programme de ligne de commande pmcmd pour arrêter ou démarrer la session.
Q # 16) Comment pouvons-nous utiliser les lots?
Répondre: Les lots sont la collection de sessions utilisées pour migrer les données de la source vers la cible sur un serveur. Les lots peuvent contenir le plus grand nombre de sessions, mais ils génèrent plus de trafic réseau alors que moins de sessions dans un lot peuvent être déplacées rapidement.
Q # 17) Qu'est-ce que la cartographie?
Répondre: Le mappage est un ensemble de sources et de cibles qui sont liées les unes aux autres via certains ensembles de transformations telles que la transformation d'expression, la transformation du trieur, la transformation d'agrégateur, la transformation du routeur, etc.
Q # 18) Qu'est-ce que la transformation?
Répondre: La transformation peut être définie comme un ensemble de règles et d'instructions à appliquer pour définir le flux de données et la charge de données à la destination.
Q # 19) Qu'est-ce que la transformation d'expression?
Répondre: Il s'agit d'une transformation de mappage utilisée pour transformer les données en un seul enregistrement à la fois. La transformation d'expression peut être passive ou connectée. L'expression est utilisée pour la manipulation des données et la génération de sortie à l'aide d'instructions conditionnelles.
Q # 20) Qu'est-ce que la transformation de la stratégie de mise à jour?
Répondre: La stratégie de mise à jour dans Informatica est utilisée pour contrôler les données qui la traversent et les étiqueter telles que INSERT, UPDATE, DELETE et REJECT. Nous pouvons définir une logique conditionnelle dans la transformation de stratégie de mise à jour pour la baliser.
Q # 21) Qu'est-ce que la transformation du trieur?
copier le DVD sur le disque dur gratuitement
Répondre: La transformation Trieur est utilisée pour trier de gros volumes de données via plusieurs ports. Elle fonctionnera probablement comme la clause ORDER BY dans SQL. La transformation du trieur peut être active, passive ou connectée.
La transformation active passe par le mappage et modifie le nombre de lignes tandis que la transformation passive passe par le mappage mais ne change pas le nombre de lignes.
La plupart des transformations INFORMATICA sont connectées au chemin des données.
Q # 22) Qu'est-ce que la transformation du routeur?
Répondre: La transformation de routeur est utilisée pour filtrer les données source. Vous pouvez utiliser la transformation de routeur pour diviser une seule source de données.
Cela ressemble beaucoup à la transformation de filtre, mais la seule différence est que la transformation de filtre utilise une seule condition de transformation et renvoie les lignes qui ne remplissent pas la condition, tandis que la transformation de routeur utilise plusieurs conditions de transformation et renvoie les lignes qui correspondent même à une seule condition.
Q # 23) Qu'est-ce que la transformation de rang?
Répondre: La transformation de rang est active et connectée. Il est utilisé pour trier et classer un ensemble d'enregistrements en haut ou en bas. Il est également utilisé pour sélectionner des données avec la valeur numérique la plus grande ou la plus petite en fonction d'un port spécifique.
Q # 24) Qu'est-ce que l'indice de classement dans la transformation de rang?
Répondre: L'indice de classement est attribué par le concepteur de tâches à chaque enregistrement. Le port d'index de rang est utilisé pour stocker la position de classement pour chaque ligne. La transformation de classement identifie chaque ligne de haut en bas, puis attribue un index de classement.
Q # 25) Qu'est-ce que le code d'état dans INFORMATICA?
Répondre: Le code fournit un mécanisme de gestion des erreurs lors de chaque session. Le code d'état est émis par la procédure stockée pour reconnaître si elle a été validée ou non et fournit des informations au serveur INFORMATICA pour décider si la session doit être arrêtée ou poursuivie.
Q # 26) Que sont les dimensions indésirables?
Répondre: La dimension indésirable est une structure qui consiste en un groupe d'attributs indésirables tels que des codes aléatoires ou des indicateurs. Il forme un cadre pour stocker les codes associés par rapport à une dimension spécifique à un seul endroit au lieu de créer plusieurs tables pour le même.
Q # 27) Qu'est-ce que Mapplet dans Informatica?
Répondre: Le mapplet est un objet réutilisable qui contient un certain ensemble de règles pour la transformation et la logique de transformation qui peuvent être utilisées dans plusieurs mappages. Le mapplet est créé dans le concepteur de mapplet dans l'outil de conception.
Q n ° 28) Qu'est-ce que Decode dans Informatica?
Répondre: Pour comprendre Decode, considérons-le comme similaire à l'instruction CASE dans SQL. Il s'agit essentiellement de la fonction utilisée par une transformation d'expression afin de rechercher une valeur spécifique dans un enregistrement.
Il peut y avoir des recherches illimitées dans la fonction Decode où un port est spécifié pour renvoyer les valeurs de résultat. Cette fonction est généralement utilisée dans les cas où il est nécessaire de remplacer les instructions IF imbriquées ou de remplacer les valeurs de recherche en recherchant dans de petites tables avec des valeurs constantes.
Decode est une fonction qui est utilisée dans la transformation Expression. Il est utilisé comme l'instruction CASE dans SQL pour rechercher un enregistrement spécifique.
Voici un exemple simple de CASE en SQL:
Syntaxe:
SELECT EMPLOYEE_ID, CASE WHEN EMPLOYEE_AGE <= 20 THEN 'Young' WHEN EMPLOYEE_AGE> 30 AND AGE <= 40 THEN 'Knowledgeable' WHEN EMPLOYEE_AGE> 40 AND AGE = 60 THEN ‘Wise’ ELSE ‘Very Wise’ END AS EMPLOYEE_WISDOM FROM EMPLOYEE
Q # 29) Qu'est-ce que la transformation des menuisiers dans INFORMATICA?
Répondre: Avec l'aide de la transformation Joiner, vous pouvez utiliser les jointures dans INFORMATICA.
Il repose sur deux sources à savoir:
- Source principale
- Source de détail
Les jointures suivantes peuvent être créées à l'aide de la transformation Joiner comme dans SQL.
- Jointure normale
- Jointure externe complète
- Jointure externe principale (jointure externe droite)
- Détail de la jointure externe (jointure externe gauche)
Q # 30) Qu'est-ce que la transformation d'agrégateur dans INFORMATICA?
Répondre: La transformation d'agrégateur peut être active ou connectée. Cela fonctionne comme la clause GROUP BY dans SQL. Il est utile d'effectuer des calculs agrégés sur des groupes dans INFORMATICA PowerCenter. Il effectue un calcul agrégé sur les données à l'aide de la fonction de type agrégé, à savoir. SUM, AVG, MAX et MIN.
Q # 31) Qu'est-ce que la transformation du générateur de séquence dans INFORMATICA?
Répondre: La transformation du générateur de séquence peut être passive ou connectée. Son utilisation de base est de générer une valeur entière avec NEXTVAL et CURRVAL.
Q # 32) Qu'est-ce que la transformation syndicale dans INFORMATICA?
Répondre: La transformation Union est utilisée pour combiner les données de différentes sources et les encadrer avec le même port et le même type de données. C'est un peu comme une clause en SQL.
Q # 33) Qu'est-ce que la transformation des qualificatifs de source dans INFORMATICA?
Répondre: La transformation du qualificateur de source est utile dans le mappage, chaque fois que nous ajoutons des fichiers plats relationnels, il est automatiquement créé. Il s'agit d'une transformation active et connectée qui représente les lignes lues par le service d'intégration.
Q # 34) Qu'est-ce que le Worklet INFORMATICA?
Répondre: Le Worklet fonctionne comme un Mapplet avec la fonctionnalité de réutilisation, la seule différence est que nous pouvons appliquer le Worklet à n'importe quel nombre de flux de travail dans INFORMATICA, contrairement à Mapplet. Worklet enregistre la logique et les tâches à un seul endroit pour les réutiliser.
Le worklet est très similaire au mapplet et est défini comme le groupe de tâches qui peuvent être réutilisables ou non au niveau du workflow. Il peut être ajouté à autant de flux de travail que nécessaire. Grâce à sa fonction de réutilisation, beaucoup de temps est économisé car la logique réutilisable peut être développée une seule fois et peut être placée à partir de là où elle peut être réutilisée.
Dans l'environnement INFORMATICA PowerCenter, les mapplets sont considérés comme la fonctionnalité la plus avantageuse. Ils sont créés dans les concepteurs de mapplets et font partie de l'outil Designer.
Il contient essentiellement un ensemble de transformations conçues pour être réutilisées dans plusieurs mappages.
On dit que les mapplets sont des objets réutilisables qui simplifient le mappage en:
- Y compris plusieurs transformations et définitions de source.
- Pas nécessaire pour se connecter à tous les ports d'entrée et de sortie.
- Acceptez les données des sources et passez à plusieurs transformations
Eh bien, dans l'ensemble, lorsqu'il est nécessaire de réutiliser la logique de mappage, la logique doit être placée dans Mapplet.
Q # 35) Qu'est-ce que SUBSTR dans INFORMATICA?
Répondre: SUBSTR est une fonction qui extrait ou supprime un jeu de caractères d'un jeu de caractères plus grand.
Syntaxe: SUBSTR (chaîne, début (, longueur))
Où,
chaîne de caractères définit le caractère que nous voulons rechercher.
début est un entier qui est utilisé pour définir la position où le comptage doit commencer.
Longueur est un paramètre facultatif utilisé pour compter la longueur d'une chaîne à renvoyer depuis sa position de départ.
Par exemple, SUBSTR (Contact, 5, 8), où nous commençons au 5ème caractère de notre contact et revenons aux 8 caractères suivants.
Q # 36) Qu'est-ce que la compatibilité des pages de codes?
Répondre: Lorsque les données sont transférées de la page de codes source vers la page de codes cible, toutes les caractéristiques de la page source doivent être présentes dans la page cible pour éviter la perte de données, cette fonctionnalité est appelée Compatibilité des pages de codes.
La compatibilité des pages de codes entre en jeu lorsque le serveur INFORMATICA s'exécute en mode de déplacement de données Unicode. Dans ce cas, les deux pages de codes sont dites identiques lorsque leurs caractères encodés sont pratiquement identiques et n'entraînent donc aucune perte de données.
Pour une précision totale, il est dit que la page de codes source est le sous-ensemble de la page de codes cible.
Q # 37) Comment pouvez-vous faire la différence entre Connected LookUp et Unconnected LookUp?
Répondre: La recherche connectée fait partie du flux de données qui est connecté à une autre transformation, elle prend l'entrée de données directement à partir d'une autre transformation qui effectue une recherche. Il utilise à la fois un cache statique et dynamique.
La recherche non connectée ne prend pas l'entrée de données d'une autre transformation, mais elle peut être utilisée comme fonction dans n'importe quelle transformation à l'aide de l'expression LKP (LookUp). Il utilise le seul cache statique.
Q # 38) Qu'est-ce que l'agrégation incrémentielle?
Répondre: L'agrégation incrémentielle est générée dès qu'une session est créée. Il est utilisé pour calculer les changements dans les données source qui ne modifient pas les données cibles avec des changements significatifs.
CUSTOMER_NO | BILL_NO | QUANTITÉ | DATE |
---|---|---|---|
1001 | 4001 | 1000 | 01/11/2016 |
2001 | 4002 | 2550 | 01/11/2016 |
3001 | 5012 | 4520 | 01/11/2016 |
1001 | 6024 | 2000 | 23/01/2016 |
1001 | 6538 | 5240 | 23/01/2016 |
2001 | 7485 | 5847 | 23/01/2016 |
1515 | 4572 | 6000 | 23/01/2016 |
Sur la première charge, la sortie est:
CUSTOMER_NO | BILL_NO | LOAD_KEY | QUANTITÉ |
---|---|---|---|
1001 | 4001 | 20011 | 1000 |
2001 | 4002 | 20011 | 2550 |
3001 | 5012 | 20011 | 4520 |
Désormais, lors du deuxième chargement, il agrégera les données avec la date de la prochaine session.
CUSTOMER_NO | BILL_NO | LOAD_KEY | QUANTITÉ | Remarques / Fonctionnement |
---|---|---|---|---|
1001 | 6538 | 20011 | 8240 | Le fichier cache est mis à jour après agrégation |
2001 | 7485 | 20011 | 8397 | Le fichier cache est mis à jour après agrégation |
3001 | 5012 | 20011 | 4520 | Pas de changement |
5858 | 4566 | 20011 | 3550 | Pas de changement |
1515 | 4572 | 20011 | 6000 | Pas de changement |
Q # 39) Qu'est-ce qu'une clé de substitution?
Répondre: Une clé de substitution est une valeur entière générée séquentiellement qui est utilisée comme autre substitut ou remplacement de la clé primaire qui est requise comme identification unique de chaque ligne dans une table.
La clé primaire peut être modifiée fréquemment selon le besoin, ce qui rend le processus de mise à jour plus difficile pour une exigence future, la clé de substitution est la seule solution à ce problème.
Q # 40) Qu'est-ce que la tâche de session et la tâche de commande?
Répondre: La tâche de session est un ensemble d'instructions à appliquer lors du transfert de données de la source vers la cible à l'aide de la commande session. La commande de session peut être une commande de pré-session ou une commande de post-session.
La tâche de commande est une tâche spécifique qui permet à une ou plusieurs commandes shell d'UNIX de s'exécuter dans Windows pendant le flux de travail
Q # 41) Quelle est la tâche de commande autonome?
Répondre: La tâche de commande autonome peut être utilisée pour exécuter la commande Shell n'importe où et à tout moment dans le flux de travail.
Q # 42) Qu'est-ce que le workflow? Quels sont les composants du Workflow Manager?
Répondre: Le flux de travail est la manière dont la tâche doit être mise en œuvre. Il s'agit d'un ensemble d'instructions qui informent le serveur sur la manière de mettre en œuvre la tâche.
Vous trouverez ci-dessous les trois principaux composants du Workflow Manager:
- Concepteur de tâches
- Développeur de tâches
- Concepteur de flux de travail
Q # 43) Qu'est-ce que l'événement et quelles sont les tâches qui y sont liées?
Répondre: L'événement peut être n'importe quelle action ou fonction qui se produit dans le flux de travail.
Il y a deux tâches qui lui sont liées, notamment:
- Tâche d'attente d'événement: Cette tâche attend qu'un événement se produise, une fois que l'événement est déclenché, cette tâche est accomplie et affecte la tâche suivante.
- Tâche d'élévation d'événements: La tâche Event Raise déclenche l'événement spécifique dans le workflow.
Q n ° 44) Qu'est-ce qu'un événement prédéfini et un événement défini par l'utilisateur?
Répondre: Les événements prédéfinis sont des événements définis par le système qui attendent l'arrivée d'un fichier spécifique à un emplacement spécifique. Il est également appelé événement File-Watcher.
Les événements définis par l'utilisateur sont créés par l'utilisateur pour être déclenchés à tout moment dans le flux de travail une fois qu'ils ont été créés.
Q # 45) Qu'est-ce que le concepteur cible et l'ordre de chargement cible?
Répondre: Target Designer est utilisé pour définir la cible des données.
Lorsqu'il existe plusieurs sources ou une seule source avec plusieurs partitions liées à différentes cibles via le serveur INFORMATICA, le serveur utilise l'ordre de chargement cible pour définir l'ordre dans lequel les données doivent être chargées sur une cible.
Q # 46) Quelle est la zone de transit?
Répondre: La zone de transit est une base de données dans laquelle sont stockées des tables temporaires connectées à la zone de travail ou des tables de faits pour fournir des entrées pour le traitement des données.
Q # 47) Quelle est la différence entre STOP et ABORT?
Réponse: Les différences sont les suivantes:
- ARRÊTER s'exécute sur la tâche de session, une fois qu'elle est déclenchée, le service d'intégration arrête uniquement de lire les données dans la source de données mais continue de les traiter et de les écrire sur la cible.
- AVORTEMENT La commande est utilisée pour arrêter complètement le service d'intégration de lire, traiter et écrire des données sur la cible. Il a son propre délai d'expiration de 60 secondes pour terminer le traitement et l'écriture des données via le service d'intégration, sinon il tue simplement la session.
Q # 48) Quels sont les différents caches LookUp?
Répondre: La recherche peut être mise en cache ou non mise en cache. Fondamentalement, il est divisé en cinq parties.
Elles sont:
- Cache statique
- Cache dynamique
- Recache
- Cache persistant
- Cache partagé
Le cache statique reste tel quel sans changement lorsqu'une session est en cours d'exécution.
Le cache dynamique se met à jour fréquemment lorsqu'une session est en cours d'exécution.
Q # 49) Comment mettre à jour la définition source?
Répondre: Il existe deux façons de mettre à jour la définition source.
Elles sont:
- Vous pouvez modifier la définition de source existante.
- Vous pouvez importer une nouvelle source à partir de la base de données.
Q # 50) Comment mettre en œuvre des mesures de sécurité à l'aide d'un gestionnaire de référentiel?
Répondre: Il existe 3 façons de mettre en œuvre des mesures de sécurité.
Elles sont:
- Autorisation de dossier au sein des propriétaires, des groupes et des utilisateurs.
- Verrouillage (lecture, écriture, récupération, sauvegarde et exécution).
- Privilèges de référentiel à savoir.
- Parcourir le référentiel.
- Utilisez le Workflow Manager (pour créer des sessions et des lots et définir ses propriétés).
- Opérateur de flux de travail (pour exécuter la session et les lots).
- Utilisez Designer, Admin Repository (permet à tout utilisateur de créer et de gérer le référentiel).
- Utilisateur administrateur (permet à l'utilisateur de créer un serveur de référentiel et de définir ses propriétés).
- SuperUser (tous les privilèges sont accordés à l'utilisateur).
Q # 51) Faites appel aux avantages d'INFORMATICA.
Répondre: Étant considéré comme l'outil d'intégration de données le plus favorisé, il existe de nombreux avantages à exploiter.
Elles sont:
- Il peut efficacement et très efficacement communiquer et transformer les données entre différentes sources de données telles que Mainframe, SGBDR, etc.
- Il s'agit généralement d'un apprentissage très rapide, robuste et facile que toute autre plate-forme disponible.
- Avec l'aide d'INFORMATICA Workflow Monitor, les travaux peuvent être facilement surveillés, les travaux ayant échoué peuvent être récupérés et les travaux lents peuvent être signalés.
- Il possède des fonctionnalités telles que le traitement facile des informations de la base de données, la validation des données, la migration de projets d'une base de données à une autre, le développement de projets, l'itération, etc.
Q # 52) Inscrivez quelques domaines ou situations en temps réel où INFORMATICA est nécessaire.
Répondre: L'entreposage de données, l'intégration de données, la migration de données et la migration d'applications d'une plate-forme vers d'autres plates-formes sont quelques exemples de domaines d'utilisation en temps réel.
Q # 53) Expliquez le programme ETL avec quelques exemples.
Répondre: Connu pour son caractère unique, l'outil ETL est synonyme d'outil d'extraction, de transformation et de chargement qui résout fondamentalement l'objectif d'extraction de données et d'envoi quelque part tel que défini en les modifiant.
Pour être très précis:
- La tâche d'extraction consiste à collecter les données à partir de sources telles que la base de données, les fichiers, etc.
- La transformation est considérée comme une modification des données reçues de la source.
- Le chargement définit le processus de transmission des données modifiées à la cible définie.
Pour comprendre de manière technique, l'outil ETL collecte des données à partir de sources hétérogènes et les modifie pour les rendre homogènes afin qu'elles puissent être utilisées plus avant pour l'analyse de la tâche définie.
Voici quelques exemples de programmes de base:
- Les mappages dérivent le processus ETL de lecture des données à partir de leurs sources d'origine où le processus de mappage est effectué dans le concepteur.
- Les flux de travail se composent de plusieurs tâches qui sont décidées et conçues dans la fenêtre du gestionnaire de flux de travail.
- La tâche consiste en un ensemble d'étapes multiples qui déterminent la séquence d'actions à effectuer pendant l'exécution.
Q # 54) Énumérez les différences entre la base de données et l'entrepôt de données.
Répondre: Reportez-vous au tableau ci-dessous pour comprendre les différences entre les deux:
python plusieurs instructions if sur une ligne
Base de données | Entrepôt de données |
---|---|
Il stocke / enregistre le courant et à jour qui est utilisé dans les opérations quotidiennes | Il stocke / analyse des données historiques qui sont utilisées pour le support d'information sur une base à long terme. |
Son orientation est sur le traitement transactionnel en ligne qui comprend des transactions simples et courtes. | Son orientation est sur le traitement analytique en ligne qui comprend des requêtes complexes. |
Il se compose de données détaillées et primitives où sa vue est relationnelle plate. | Il se compose de données consolidées résumées où sa vue est multidimensionnelle. |
De faibles performances sont observées pour les requêtes analytiques. | Les requêtes analytiques sont ici jugées performantes. |
L'efficacité est déterminée en mesurant le débit des transactions. | L'efficacité est déterminée en mesurant le débit des requêtes et le temps de réponse. |
Q # 55) Expliquez les fonctionnalités de la recherche Connecté et Non connecté.
Réponse: Les fonctionnalités de la recherche connectée peuvent être expliquées comme suit:
- Il existe une source d'entrée directe du pipeline pour la recherche connectée.
- Il participe activement au flux de données et le cache dynamique et statique est utilisé le cas échéant.
- Il met en cache toutes les colonnes de recherche et renvoie les valeurs par défaut comme sortie lorsque la condition de recherche ne correspond pas.
- Plusieurs valeurs de colonne peuvent être renvoyées au port de sortie.
- Plusieurs valeurs de sortie sont transmises et les ports de sortie sont liés à une autre transformation.
- La recherche connectée prend en charge les valeurs par défaut définies par l'utilisateur.
Les fonctionnalités de la recherche non connectée peuvent être expliquées comme suit:
- La recherche non connectée utilise un cache statique et sa source d'entrée est le résultat reçu de la sortie de l'expression LKP.
- Il met uniquement en cache les ports de sortie de recherche et renvoie la valeur NULL lorsque la condition de recherche ne correspond pas.
- Une seule colonne est renvoyée de chaque port.
- Une seule valeur de sortie est transmise à une autre transformation.
- Les valeurs par défaut définies par l'utilisateur ne sont pas prises en charge par la recherche non connectée.
Q # 56) Pendant la session en cours d'exécution, les fichiers de sortie sont créés par le serveur Informatica. Recrutez-en quelques-uns.
Répondre: Mentionnés ci-dessous sont les quelques fichiers de sortie:
- Fichiers cache: Ces fichiers sont créés au moment de la création du cache mémoire. Pour des circonstances telles que la transformation de recherche, la transformation d'agrégateur, etc., les fichiers d'index et de cache de données sont créés par le serveur Informatica.
- Fichier de détail de la session: Comme son nom le définit, ce fichier contient des statistiques de chargement comme le nom de la table, les lignes rejetées ou écrites pour chaque cible dans le mappage et peut être visualisé dans la fenêtre du moniteur.
- Fichier de détail des performances: Ce fichier fait partie de la feuille de propriétés de la session et contient des informations sur les performances de session afin de déterminer les domaines d'amélioration.
- Journal du serveur INFORMATICA: Le serveur crée un journal pour tous les messages d'état et d'erreur et peut être consulté dans le répertoire de base.
- Fichier journal de session: Pour chaque session, le serveur crée un fichier journal de session en fonction du niveau de traçage défini. Les informations qui peuvent être vues dans les fichiers journaux sur les sessions peuvent être:
- Processus d'initialisation de session,
- Création de commandes SQL pour les threads de lecture et d'écriture,
- Liste des erreurs rencontrées et
- Résumé de la charge
- E-mail post-session: Cela aide à communiquer automatiquement les informations sur la session (session terminée / session échouée) aux destinataires souhaités.
- Rejeter le fichier: Ce fichier contient des informations sur les données qui n'ont pas été utilisées / écrites sur les cibles.
- Fichier de contrôle: Dans le cas où la session utilise le chargeur externe, le fichier de contrôle se compose d'instructions de chargement et de format de données sur le fichier cible.
- Fichier indicateur: Ce fichier contient essentiellement un nombre qui met en évidence les lignes marquées pour INSERT / UPDATE / DELETE ou REJECT.
- Fichier de sortie: Le fichier de sortie est créé en fonction des propriétés du fichier.
Q # 57) Comment différencier les transformations actives et passives?
Répondre: Pour comprendre la différence entre les transformations actives et passives, voyons ses caractéristiques qui expliqueront les différences d'une meilleure manière.
L'action effectuée par les transformations actives comprend:
- Modification du nombre de lignes selon l'exigence, qui passe par les transformations. Par exemple, Transformation de filtre qui supprime la ligne qui ne remplit pas la condition.
- Modification de la limite de transaction en définissant les points de restauration et de validation. Par exemple, Transformation du contrôle des transactions.
- Modification du type de ligne pour INSERT / UPDATE / DELETE ou REJECT.
L'action effectuée par les transformations passives comprend:
- Le nombre de lignes passant par la transformation n'est jamais modifié.
- La limite de transaction est définie.
- Le type de ligne est défini.
Q # 58) Demandez les différents types de transformations.
Réponse: Les différents types de transformations sont les suivants:
- Transformation d'agrégateur
- Transformation d'expression
- Transformation de normalisateur
- Transformation de rang
- Transformation de filtre
- Transformation de menuisier
- Transformation de recherche
- Transformation de procédure stockée
- Trier la transformation
- Mettre à jour la transformation de la stratégie
- Transformation de qualificatif de source XML
- Transformation du routeur
- Transformation du générateur de séquence
Q # 59) Qu'est-ce que le cache dynamique?
Répondre: Les recherches INFORMATICA peuvent être classées comme mises en cache ou non mises en cache. Dans le cas du cache dynamique, les lignes peuvent être insérées ou supprimées au moment du passage des lignes et sont synchronisées avec la cible. La mémoire cache est actualisée à chaque fois après les opérations de suppression / mise à jour au sein de la session.
Q # 60) Qu'est-ce que le décodage dans le cache statique?
Répondre: Le cache statique est celui qui n'est ni mis à jour ni actualisé lors de l'exécution de la session. Il s'agit du cache par défaut et ne renvoie la valeur que lorsque la condition de retour est vraie. Dans d'autres cas, il renvoie une valeur Null. L'insertion ou la mise à jour du cache ne peuvent pas être effectuées dans ce cas.
Q # 61) Mentionnez quelques avantages de la transformation de routeur par rapport à la transformation de filtre.
Répondre: La transformation de routeur et la transformation de filtre sont identiques car toutes deux utilisent une condition pour tester et filtrer les données.
Cependant, les avantages du routeur par rapport à la transformation de filtre peuvent être compris par les points mentionnés ci-dessous.
Transformation du routeur:
- Il permet plusieurs conditions de test.
- Fournit la possibilité de tester les mêmes données d'entrée sur plusieurs nombres de conditions.
- Dans le cas du mappage, les données d'entrée ne sont traitées qu'une seule fois par le serveur et donc les performances sont améliorées.
- Moins complexe et plus efficace.
- Les enregistrements qui échouent à la condition de test ne sont jamais bloqués à la place sont transmis au groupe par défaut.
Q # 62) Enregistrez certaines propriétés des sessions.
Répondre: Une session est disponible dans le gestionnaire de workflow et est configurée en créant une tâche de session. Dans un programme de cartographie, il peut y avoir plusieurs sessions et il peut être réutilisable ou non réutilisable.
Certaines des propriétés de la session sont les suivantes:
- Conformément aux exigences, les tâches de session peuvent être exécutées simultanément ou séquentiellement.
- Une session peut être configurée pour analyser les performances.
- Pour créer ou exécuter une tâche de session, il est nécessaire de disposer d'informations générales sur le nom de session, la planification et le service d'intégration.
- Une autre propriété importante de la session comprend le fichier journal de session, la charge de test, la gestion des erreurs, l'intervalle de validation, les propriétés de la cible, etc.
Q # 63) Inscrivez les tâches pour lesquelles la transformation de qualificateur de source est utilisée.
Répondre: Le qualificateur de source est considéré comme une transformation active qui lit les lignes impliquées dans le service d'intégration au sein de la session en cours d'exécution. Il détermine la manière dont les données sont extraites de la source et sont automatiquement ajoutées lors de l'ajout d'une source au mappage.
La liste des différentes tâches où le qualificateur de source est utilisé est la suivante:
- Filtrage des lignes
- Tri des données
- Création de requêtes personnalisées
- Joindre des tables de la même source
- Sélection de valeurs distinctes
Q # 64) Mentionner quelques applications client Power Center avec leur objectif de base?
Répondre: Des tâches telles que la création de sessions et de workflows, la surveillance de la progression des workflows, la conception de mapplets, etc. sont effectuées par les applications client PowerCenter.
Vous trouverez ci-dessous la liste des applications client PowerCenter avec leur objectif:
- Gestionnaire de référentiel: C'est un outil administratif et son objectif principal est de gérer les dossiers, objets, groupes, etc. du référentiel
- Console d'administration: Ici, les tâches de service telles que démarrage / arrêt, sauvegarde / restauration, mise à niveau / suppression, etc. sont effectuées.
- Concepteur du centre d'alimentation: Le concepteur se compose de divers outils de conception qui servent à des fins diverses. Ces outils de conception sont:
- Analyseur de source
- Concepteur de cibles
- Développeur de transformation
- Concepteur de mapplet
- Gestionnaire de mappage
- Gestionnaire de flux de travail: Son objectif principal est de définir un ensemble d'instructions / workflow requis pour exécuter les mappages conçus dans le concepteur. Pour vous aider à développer un workflow, 3 outils sont disponibles, à savoir le développeur de tâches, le concepteur de workflow, le concepteur de worklet.
- Moniteur de flux de travail: Comme son nom l'indique, le moniteur de flux de travail surveille le flux de travail ou les tâches. La liste des fenêtres disponibles sont:
- Fenêtre du navigateur
- Fenêtre de sortie
- Fenêtre de temps
- Fenêtre des propriétés
- Vue des tâches
- Vue de diagramme de Gantt
Conclusion
J'espère que vous devez maintenant avoir une idée claire de l'outil et du type de questions qui seront posées lors des entretiens.
INFORMATICA est la meilleure solution pour effectuer l'intégration de données. Il fonctionne avec la gestion multi-données dans un environnement multi-plateforme tel que Windows, Linux, Unix, etc. et est testé sur plus de 50 000 plates-formes pour de meilleurs résultats et de meilleures performances parmi plusieurs autres.
En un mot, INFORMATICA est un outil ETL qui rassemble des informations ou des données provenant de diverses sources et charge ces informations vers les cibles spécifiques définies sans les enregistrer. Sa tâche est de fournir divers services et ressources à différentes machines et, par conséquent, les données fournies doivent être correctes avec des résultats remarquables.
Apprenez à mieux connaître les concepts Informatica grâce à cet article et préparez-vous immédiatement pour votre entretien.
Tous mes vœux!!!
lecture recommandée
- Questions et réponses d'entrevue
- Questions et réponses d'entrevue de test ETL
- Quelques questions et réponses difficiles sur les tests manuels
- Top 32 des meilleures questions et réponses d'entrevue de datastage
- Questions et réponses sur les entretiens avec Teradata
- Top 30 des questions et réponses d'entrevue SAS
- Top 24 des questions d'entrevue de modélisation de données avec des réponses détaillées
- 10 meilleurs outils d'analyse de données pour une gestion parfaite des données (2021 LIST)
- Fonction de pool de données dans IBM Rational Quality Manager for Test Data Management
- Concept, processus et stratégie de gestion des données de test
- Top 14 des MEILLEURS outils de gestion des données de test en 2021