Description
Stata est particulièrement utilisé par la communauté scientifique pour les recherches en médecine, biologie et économie. Stata repose sur un noyau compilé qui comprend les principales instructions et qui peut éventuellement appeler des procédures annexes (fichiers .ado) livrées en standard ou à télécharger sur les sites miroirs de Stata. Ces paquets ado sont des programmes écrits en langage Stata, développés par StataCorp ou bien par des programmeurs (enseignants, scientifiques, utilisateurs, étudiants, etc.) qui ont livré leurs sources à Stata pour en faire bénéficier l'ensemble des utilisateurs. La communauté des utilisateurs est donc impliquée dans le développement de packages, et dans la publication de méthodes dans un journal scientifique créé par StataCorp [extrait du Stata Journal].
Versions disponibles
Stata 14 et Stata 14 MP/4 (version multiprocesseurs de Stata 14) sur smcs3 et smcs4.
Utilisation sur le serveur
On distingue deux modes d'utilisation de Stata sous Linux suivant que l'on dispose ou pas d'une station, ou d'un terminal X, ou d'une émulation X-Windows. Cependant, Stata comportant une partie graphique importante, son utilisation en mode non graphique ne vous donnera pas accès à l'ensemble de ses possibilités.
Connectez-vous au serveur de la manière habituelle par ssh (cf. www.uclouvain.be/327879) à l'aide de vos login et mot de passe. Si votre code et vos données se trouvent sur votre ordinateur local, vous devez les transférer dans votre home par scp ou sftp dans un terminal ou avec un programme comme FileZilla ou WinSCP (cf. FAQ du serveur de calcul). Une fois cela réalisé, vous pouvez exécuter un programme Stata en batch en entrant la commande nohup stata-se -b do program & dans le terminal (attention la commande stata exécute STATA IC et pas STATA SE). Le programme program.do sera exécuté et les résultats se trouveront dans program.log. Les graphiques n'étant pas sauvegardés dans le fichier program.log, il faut indiquer dans le fichier do de les sauver. Cette méthode a comme avantage qu'elle permet de lancer un programme, de se déconnecter et de se reconnecter plus tard pour récupérer les résultats quand l'exécution du programme est terminée.
Pour utiliser la version MP/4, il suffit de remplacer le mot stata-se par stata-mp dans la commande ci-dessus, ce qui donne: nohup stata-mp -b do program &. L'avantage de cette version est qu'elle est plus rapide puisque le code peut utiliser quatre cœurs ou processeurs simultanément. Malheureusement, le gain médian est de 2 car certaines fonctions ne sont pas parallélisées. Il est possible de connaitre le gain de temps fonction par fonction en feuilletant l'annexe du Performance Report de Stata MP .
L'autre manière de travailler avec Stata sur le serveur est d'exécuter la commande xstata, ou xstata-se ou xstata-mp, dans le terminal après s'être connecté en ssh avec l'option -X. L'avantage de cette commande est que vous pouvez travailler dans un environnement graphique donc vous pouvez voir les graphiques créés par le code. Par contre, vous ne pouvez plus vous déconnecter sans arrêter votre programme et surtout il faut avoir un serveur X installé localement (ce n'est pas un problème pour les utilisateurs Linux et Mac mais les utilisateurs de Windows doivent installer un programme émulant un terminal X comme Xming). L'utilisation de l'interface graphique implique donc l'exécution de programmes courts car un risque de déconnexion est toujours possibles sur le réseau.
En cas de questions
Pour demander l’installation de packages supplémentaires ou en cas de problèmes lors de l'utilisation de Stata sur le serveur, vous pouvez contacter serveurs-smcs@uclouvain.be.