top 30 sas interview questions
Liste des questions d'entrevue SAS les plus fréquentes avec réponses:
Dans cet article, nous examinerons certains des concepts de base et avancés de la programmation SAS à travers les questions et réponses d'entretien SAS les plus fréquemment posées.
Le système d'analyse statistique, communément appelé SAS, est considéré comme un ensemble de logiciels multiples intégrés et utilisés pour diverses opérations telles que la gestion des données, l'analyse prédictive et descriptive, l'amélioration de la qualité, l'analyse commerciale, le développement d'applications, etc.
La personnalisation du grand nombre de composants de SAS, ainsi que la fonctionnalité d’approche de programmation étendue, effectuent des tâches d’analyse et de transformation de données. Il peut fonctionner sur n'importe quel système d'exploitation (Linux, Windows, etc.) car il est indépendant de la plate-forme.
Questions et réponses d'entretiens SAS les plus populaires
Nous y voilà..
Q # 1) Faites appel aux fonctions exécutées par SAS.
Répondre: SAS (Statistical Analysis System) a sa propre importance dans chaque domaine d'activité.
Voici quelques-unes des fonctions résumées exécutées par SAS:
- Gestion des données et gestion de projet
- Entreposage de données
- Recherche opérationnelle et aide à la décision
- Recherche d'informations et gestion de la qualité
- Planning d'affaires
- Analyses statistiques
Q # 2) Quels sont les 3 composants de la programmation SAS?
Répondre: Les 3 composants de la programmation SAS sont:
- Déclarations
- Variables
- Base de données
Q # 3) Inscrivez les règles de syntaxe suivies dans les instructions SAS.
Répondre: Le programme SAS est écrit dans la fenêtre de l'éditeur. Ici, il contient une série d'instructions suivies de la syntaxe appropriée dans un ordre pour que le programme SAS le comprenne.
Certaines des règles de syntaxe suivies dans le cas du composant Statement de SAS sont les suivantes:
- La fin de toute instruction est marquée par un point-virgule (;).
- Un point-virgule est également utilisé pour séparer plusieurs instructions qui apparaissent sur une seule ligne.
- Les instructions SAS ne sont pas sensibles à la casse et à un espacement supplémentaire avant la suppression automatique des instructions.
- Les commentaires peuvent être inclus dans le programme SAS pour les instructions de deux manières différentes:
- Une ligne commençant par un astérisque (*) et se terminant par un point-virgule (;).
- Une ligne commençant par une barre oblique et un astérisque (/ *) et se terminant par un astérisque et une barre oblique (* /).
Q # 4) Quels sont les types de données que contient SAS?
Répondre: «Numérique» et 'Personnage' sont les deux types de types de données que contient le programme SAS.
Q # 5) Que sont PDV et leurs fonctions?
Répondre: Le vecteur de données de programme (PDV) est un concept logique et est défini comme une zone de mémoire où un ensemble de données est construit par SAS.
Les fonctions de PDV sont les suivantes:
- Une base de données contenant une observation à la fois est créée.
- Le tampon d'entrée pour contenir les données d'un fichier externe est créé au moment de la compilation.
- PDV contient deux variables automatiques à savoir, _N_ (affiche le décompte de l'étape de données en cours d'exécution) et _ERROR_ (notifie l'erreur qui se produit au moment de l'exécution).
Q # 6) Que savez-vous de l'ensemble de données SAS?
Répondre: L'ensemble de données SAS est essentiellement appelé les données disponibles pour l'analyse dans un programme SAS. L'ensemble de données SAS est également appelé table de données SAS.
Le tableau de données SAS se compose de deux parties:
- Colonnes de variables
- Rangées d'observations
Les informations utiles sur l'ensemble de données SAS peuvent être résumées comme suit:
- SAS Dataset peut lire aussi bien qu'il a des sources de données intégrées pour une utilisation comme Excel, Access, etc.
- L'ensemble de données qui est utilisé uniquement dans la session en cours d'exécution et ignoré après la fin de la session est appelé ensemble de données temporaire.
- L'ensemble de données qui est stocké pour une utilisation dans la session future est également appelé ensemble de données permanent.
- L'ensemble de données intégré est accessible via ce chemin Bibliothèques -> Mes bibliothèques-> SASHELP.
Q # 7) Expliquez pourquoi le double @@ est utilisé dans les instructions d'entrée?
Répondre: Au cours de l'itération de l'étape de données, l'inclusion d'un double @@ dans les instructions Input implique que SAS doit conserver l'enregistrement en cours aux fins de l'exécution de l'instruction Input suivante plutôt que de passer au nouvel enregistrement.
Q # 8) Expliquez la différence entre les options NODUP et NODUPKEY?
Répondre: Pour supprimer les valeurs en double de la table, PROC SORT est essentiellement classé entre deux options:
- NODUP
- NODUPKEY
La différence entre ces deux options peut être vue ci-dessous:
NODUPKEY | NODUP |
---|---|
Compare uniquement la variable BY présente dans l'ensemble de données. | Compare toutes les variables présentes dans l'ensemble de données. |
Supprime les options en double pour les valeurs de variable répertoriées dans l'instruction BY. | Identifie et élimine les observations en double. |
Syntaxe: PROC SORT DATA = readin NODUPKEY; BY nom de variable; COURS; | Syntaxe: PROC SORT DATA = readin NODUP; BY nom de variable; COURS; |
Q # 9) Quelle commande est utilisée pour effectuer le tri dans le programme SAS?
Répondre: La commande PROC SORT est utilisée pour effectuer le tri, que ce soit sur une seule variable ou sur plusieurs variables. Cette commande est exécutée sur l'ensemble de données où le nouvel ensemble de données est créé à la suite du tri, mais l'ensemble de données d'origine reste inchangé.
Syntaxe:
PROC SORT DATA=original OUT=Sorted; BY variable;
Où,
«Original» fait référence à l'ensemble de données d'origine
«Trié» fait référence au résultat en tant qu’ensemble de données trié
«Variable» fait référence à la colonne sur laquelle l'opération de tri est effectuée.
Le tri peut être effectué dans l'ordre croissant et décroissant.
Pour que l'ensemble de données s'affiche dans l'ordre décroissant, le mot-clé «Décroissant» est utilisé dans l'instruction BY avec le nom de la colonne sur laquelle le tri doit être effectué.
PROC SORT DATA=original OUT=Sorted; BY DESCENDING variable
Q # 10) Expliquez la différence entre Informat et Format avec un exemple.
Répondre: La différence entre Informat et Format peut être expliquée comme suit:
En savoir plus | Format |
---|---|
Indiquez à SAS comment lire les données dans la variable SAS. | Indiquez à SAS comment afficher les valeurs dans la variable. |
Ceux-ci sont utilisés pour lire les données ou prendre des données d'entrée à partir de fichiers externes. | Ceux-ci sont utilisés pour écrire les données. |
Q # 11) Différenciez INPUT et INFILE.
Répondre: L'inclusion d'une instruction INFILE dans la programmation SAS identifie un fichier externe qui comprend les données, tandis que l'inclusion d'une instruction INPUT dans la programmation SAS décrit les variables utilisées.
La syntaxe pour INFILE:
INFILE ‘filename’;
La syntaxe de INPUT:
INPUT ‘varname1’ ‘varname2’;
Q # 12) Expliquez l'utilisation du contenu PROC print et PROC?
Répondre: L'étape PROC du programme SAS est utilisée pour appeler des procédures intégrées d'analyse des données de l'ensemble de données.
Impression PROC: Garantit que les données présentes dans l'ensemble de données sont lues correctement.
Contenu du PROC: Affiche les informations sur l'ensemble de données SAS.
Q # 13) Expliquez DATA_NULL_?
Répondre: Comme son nom le définit, DATA_NULL_ est une étape de données qui ne crée en fait aucun ensemble de données.
Il est utilisé pour:
- Créer des variables macro.
- Écriture de la sortie sans aucun jeu de données.
Q # 14) Comment la variable de caractère est-elle convertie en une variable numérique et vice versa?
Répondre: Sous la programmation SAS, il se produit de nombreuses tâches où une valeur de caractère doit être convertie en valeur numérique et de la même manière, une valeur numérique doit être convertie en valeur de caractère.
METTRE() est utilisé pour convertir le numérique en caractère. Dans ce cas, le format source et le type de variable source doivent toujours être similaires.
Exemple:
char_var= PUT( num_var, 6.);
INPUT () est utilisé pour convertir un caractère en numérique. Dans ce cas, le type de variable source doit toujours être des variables de caractère.
Exemple:
Num_var= INPUT(char_var,2.0);
Q # 15) Quel est le but de _CHARACTER_ et _NUMERIC_?
Répondre: Dans l'ensemble de données actuel,
_PERSONNAGE_ définit toutes les variables de caractères actuellement définies.
Exemple : Pour inclure toutes les variables de caractères dans PROC MEANS, les instructions suivantes sont utilisées:
PROC MEANS; Var_character_; Run;
_NUMERIC_ définit toutes les variables numériques actuellement définies.
Exemple: Pour inclure toutes les variables numériques dans PROC MEANS, les instructions suivantes sont utilisées:
PROC MEANS; Var_numeric_; Run;
Q # 16) Quelles commandes sont utilisées dans le cas de l'inclusion ou de l'exclusion de variables spécifiques dans l'ensemble de données?
Répondre: Les options DROP, KEEP et data set sont utilisées à cette fin.
La variable que nous voulons supprimer de l'étape de données est spécifiée dans l'instruction DROP.
La variable que nous voulons conserver de l'étape de données est spécifiée dans l'instruction KEEP.
Q # 17) Faites la différence entre PROC MEANS et PROC SUMMARY.
Répondre: La différence entre PROC MEANS et PROC SUMMARY peut être comprise comme suit:
PROC signifie | RÉSUMÉ DU PROC |
---|---|
Cette procédure produit le rapport imprimé par défaut dans la fenêtre OUTPUT. | Cette procédure inclut le PRINT dans l'instruction pour produire le rapport imprimé. |
PROC MEANS prend par défaut toutes les variables numériques de l'analyse. | PROC SUMMARY prend les variables dans l'analyse statistique qui sont décrites dans l'instruction VAR. |
Q # 18) Expliquez le but des fonctions SUBSTR dans la programmation SAS.
Répondre: Dans la programmation SAS, chaque fois que le programme a besoin d'abstraire une sous-chaîne, la fonction SUBSTR est utilisée dans le cas d'une variable caractère.
Lorsqu'une position de départ et une longueur sont spécifiées, cette fonction est utilisée pour extraire la chaîne de caractères.
Syntaxe: SUBSTR (char_var, début, longueur);
Q # 19) Nommez et décrivez brièvement quelques fonctions de caractères SAS utilisées pour le nettoyage des données.
Répondre: Quelques fonctions de caractère SAS utilisées pour le nettoyage des données sont répertoriées ci-dessous:
- Compresser (char_string) La fonction est utilisée pour supprimer les espaces ou certains caractères spécifiés d'une chaîne donnée.
- TRIM (str) La fonction est utilisée pour supprimer les blancs de fin d'une chaîne donnée.
- BASSE (chaîne_car) La fonction est utilisée pour convertir tous les caractères d'une chaîne donnée en minuscules.
- UPCASE (chaîne_car) La fonction est utilisée pour convertir tous les caractères d'une chaîne donnée en majuscules.
- COMPBL (str) La fonction est utilisée pour convertir plusieurs blancs en un seul blanc.
Q # 20) Mentionnez quelques façons dont une «recherche de table» est effectuée dans la programmation SAS.
Répondre: Dans la programmation SAS, les valeurs de recherche de table peuvent être stockées des manières suivantes:
- Code
- Déployer
- Objet de hachage
- Format
- Base de données
Les techniques suivantes sont utilisées pour effectuer une «recherche de table» dans SAS respectivement:
- Instructions SELECT / WHEN ou IF / THEN
- Valeur d'index du tableau
- Valeur de clé d'objet de hachage
- Instruction FORMAT, fonction PUT
- Fusionner, joindre, KEY = Option
Voyons un exemple qui montre la manière «Code» d’effectuer une recherche de table en utilisant des instructions «IF / THEN»:
data location; set myinfo; if AreaCode='226' then Location='Ontario, Canada'; else if AreaCode='212' then Location='New York, NY'; else Location='Unknown'; run;
Q # 21) Faites la différence entre les fonctions CEIL et FLOOR.
Réponse: fonction CEIL est utilisé pour tronquer les valeurs numériques où il affiche la sortie comme le plus petit entier. Par le plus petit entier, signifie ici que la valeur entière est supérieure / égale à l'argument.
Exemple: CEIL (12.85) affichera la sortie comme 13.
Fonction FLOOR est utilisé pour tronquer les valeurs numériques où il affiche la sortie comme le plus grand entier. Par le plus grand entier, signifie ici que la valeur entière est inférieure / égale à l'argument.
Exemple: FLOOR (12.85) affichera la sortie 12.
Q # 22) De quelles manières les variables macro peuvent-elles être créées dans la programmation SAS?
Répondre: Eh bien, un certain nombre de techniques différentes peuvent être utilisées pour créer des macro-variables dans la programmation SAS.
Voici les cinq méthodes les plus couramment utilisées:
- Instruction% LET
- Paramètres de macro (nommés ainsi que positionnels)
- Instruction% DO (itérative)
- INTO dans PROC SQL
- Routine CALL SYMPUTX
Q # 23) Expliquez le but de l'instruction RETAIN.
Répondre: Étant donné que le sens du mot «RETAIN» signifie conserver la valeur une fois attribuée, l’objectif de l’instruction RETAIN est le même dans la programmation SAS que son sens l’implique.
Dans un programme SAS, lorsqu'il est nécessaire de passer de l'itération en cours à la suivante de l'étape de données, à ce moment, l'instruction RETAIN indique à SAS de conserver les valeurs plutôt que de les définir comme manquantes.
Exemple: Imprimons un programme qui affichera la valeur de sortie de «z» à partir de 1 en utilisant l'instruction RETAIN.
data abc; set xyz; RETAIN z 0; z = z + 1; run;
Q # 24) Quelle commande est utilisée pour enregistrer les journaux dans le fichier externe?
Répondre: PROCESSUS IMPRIMÉ La commande est utilisée pour enregistrer les journaux dans le fichier externe.
meilleure application de téléphone espion pour android
Exemple:
PROC PRINTTO log='C:UsersabcDownloadsLOG11.txt' new; run;
Q # 25) Mentionnez certaines erreurs courantes qui sont généralement commises dans la programmation SAS.
Répondre: Vous trouverez ci-dessous quelques-unes des erreurs courantes qui sont généralement commises, en particulier lorsque vous êtes nouveau dans ce langage de programmation.
- La syntaxe de base comprend un point-virgule à la fin de chaque instruction et l'absence d'un point-virgule est l'erreur la plus courante.
- Vous ignorez la vérification des journaux après avoir soumis le programme.
- Commenter des erreurs comme ne pas utiliser les commentaires si nécessaire ou utiliser les commentaires de manière inappropriée.
- Ne pas utiliser les méthodes de débogage appropriées.
Q # 26) Mentionnez les options du système SAS pour déboguer les macros SAS.
Répondre: Pour aider à suivre le code macro ainsi que le code SAS généré par les macros, certaines options système peuvent être utilisées.
Elles sont:
- MLOGIC
- MPRINT
- SYMBOLES
Le message qui sera généré par ces options système peut être vu dans le journal SAS.
Q # 27) Faites la différence entre les fonctions SAS et les procédures SAS.
Répondre: Les principales différences peuvent être découvertes / comprises par le cas expliqué pour les fonctions et les procédures SAS.
Cas:
Pour Fonction , la valeur de l'argument est fournie ou, par exemple, prise pour le calcul à travers l'observation mentionnée dans l'énoncé de programme alors que, dans le cas de Procédure , chaque observation ne devrait avoir qu'une seule variable par laquelle le calcul est effectué comme indiqué dans l'exemple ci-dessous.
Comprenons-le avec des exemples:
data average; set temp; avgtemp = mean( of T1 – T24 ); run;
Ici, dans les exemples ci-dessus, les arguments passés à la fonction moyenne sont pris pour le calcul comme une observation.
proc sort; by month; run; proc means; by month; var avgtemp; run;
Ici, dans l'exemple ci-dessus, la fonction Proc means calcule la température moyenne pour un argument qui est passé comme observation, c'est-à-dire par mois.
Q # 28) Que savez-vous de SYMPUT et SYMGET?
Réponse: Les principales différences entre les deux sont mentionnées ci-dessous.
SYMPUT est utilisé pour stocker la valeur d'un ensemble de données dans la variable macro tandis que SYMGET est utilisé pour récupérer la valeur de la variable macro vers l'ensemble de données.
Q # 29) Expliquez les délimiteurs d'entrée spéciaux utilisés dans la programmation SAS.
Répondre: Les délimiteurs d'entrée spéciaux utilisés dans la programmation SAS sont:
- DLM
- DSD
Ils sont utilisés dans l'instruction «INFILE» et DSD a la fonctionnalité d'ignorer les délimiteurs qui apparaissent entre guillemets.
Q # 30) Quelle fonction est utilisée pour compter le nombre d'intervalles entre deux dates SAS?
Répondre: La fonction d'intervalle INTCK est utilisée pour compter le nombre d'intervalles entre deux dates SAS données.
Syntaxe:
INTCK(interval,start-of-period,end-of-period)
Conclusion
Jusqu'à présent, nous avons vu plusieurs questions et réponses qui vous auraient donné une compréhension claire des concepts de programmation SAS et vous ont donné une idée de la nature des questions posées lors des entretiens SAS.
Eh bien, si vous êtes nouveau dans la programmation SAS, la connaissance de certaines technologies de programmation informatique et la familiarité avec SQL (Structured Query Language) sera un avantage supplémentaire pour vous pour comprendre et apprendre SAS rapidement.
J'espère que vous êtes prêt à affronter toute interview SAS en toute confiance !!