IBM SPSS MODELER
permet d’accéder aux différents sources données dans des serveurs locaux et/ou externes.
Il vous permet d’effectuer des opérations sur des données telles que: agrégation, fusion de données, sélection d’enregistrements et bien d’autres.
Le programme assure l’intégration avec les bases de données, de sorte que toutes les opérations de données peuvent être envoyées pour mise en œuvre dans un système de gestion de base de données.

Intégration avec des bases de données : Travailler avec des données dans des bases de données en traduisant vos propres commandes en code SQL et en créant vous-même des requêtes SQL

IBM SPSS Modeler permet d’accéder aux bases de données telles que Microsoft SQL Server, DB2, Oracle et autres. Une fois connecté à la source de données, vous pouvez sélectionner des variables dans une table ou une vue spécifique.

Des opérations telles que: randomisation, agrégation, sélection d’enregistrements et calcul de nouveaux, transformation d’attributs existants peuvent être effectuées directement dans la base de données. Les opérations de données définies à l’aide de l’interface du programme peuvent être automatiquement traduites en code SQL et envoyées pour exécution dans le système de base de données. Il est également possible de créer vous-même des commandes SQL.

Importation de données : Importer des données à partir de diverses sources – incl. Fichiers IBM SPSS Statistics, feuilles de calcul comme Excel et fichiers texte

Lors de l’importation d’un fichier IBM SPSS Statistics, le programme vous permet de choisir de gérer ou non les libellés et les valeurs des variables.

Lors de l’importation de données à partir d’Excel, le programme vous permet de sélectionner une feuille, de spécifier une plage de cellules dans la feuille et de charger des en-têtes de données.

Lors de l’importation de données à partir d’un fichier texte, le programme vous permet de prévisualiser les données et d’entrer vos propres paramètres d’importation (y compris la lecture des noms de variables à partir des en-têtes de colonne, la suppression des espaces inutiles, la reconnaissance automatique des dates et des heures).

La fusion des données: Combinez les données de plusieurs fichiers ou tables de base de données en ajoutant des enregistrements ou en ajoutant des colonnes.

Le programme vous permet de combiner des fichiers de données, par exemple de différentes périodes, différentes régions. Vous pouvez créer une variable qui identifie la source de chaque observation. Le programme permet également de joindre diverses tables à partir de bases de données en utilisant des méthodes de jointure un-à-un ou un-à-plusieurs et de contrôler la manière de joindre des tables (jointures internes et externes, etc.).

Vous pouvez utiliser des clés de jointure simples ou complexes, ou joindre selon l’ordre dans lequel les enregistrements semblent correspondre correctement aux cas des deux tables. La fusion des données est possible même en cas de non-concordance partielle entre les ensembles.

Sélection et filtrage: Sélection des enregistrements et sélection des colonnes pour les analyses.

Le programme permet la sélection d’enregistrements qui satisfont à n’importe quelle condition définie par l’utilisateur pour une analyse plus approfondie. Lors de la création des conditions de sélection, il est possible d’utiliser le générateur d’expression ainsi que le large éventail de fonctions de programme internes ou de fonctions de base de données disponibles.

L’outil vous permet de valider la formule créée. Il est également possible de renommer ou d’exclure des variables à tout moment du flux.

Agrégation de données: Agrégation de données en calculant des statistiques et des mesures pour les dimensions de données indiquées

Le programme vous permet de calculer des statistiques pour des groupes d’enregistrements en fonction des attributs spécifiés qui sont des dimensions d’agrégation. Si l’attribut de regroupement n’est pas défini, les statistiques seront calculées pour tous les enregistrements traités comme un seul groupe.

Les fonctions d’agrégation disponibles incluent des statistiques telles que: moyenne, médiane, somme, variance, écart type, minimum, maximum, 1 quartile, 3 quartile. Il est également possible d’écrire une variable indiquant le nombre d’enregistrements dans chaque groupe.