Master en science des données, UCAM
Sharjah, Émirats arabes unis
Master
DURÉE
12 mois
LANGUES
Anglais
RYTHME
À plein temps
DATE LIMITE D'INSCRIPTION
DATE DE DÉBUT AU PLUS TÔT
FRAIS DE SCOLARITÉ
FORMAT D'ÉTUDE
Apprentissage à distance
Le Master en science des données fournit des compétences, des connaissances et une compréhension transférables qui peuvent être appliquées dans le contexte commercial hautement compétitif et évolutif d'aujourd'hui. Les unités sont alignées sur les Normes professionnelles nationales pour les entreprises et représentent les attributs de base requis par les employeurs dans une gamme de contextes commerciaux. Cette qualification vise à fournir aux apprenants :
- Une compréhension des compétences essentielles requises pour travailler avec succès dans le secteur de la gestion d'entreprise
- Les outils pour préparer intellectuellement et pratiquement les apprenants à une performance efficace sur leur lieu de travail/d'emploi
- Les compétences requises pour résoudre des problèmes dans un environnement d'affaires
- La volonté de gérer diverses organisations sur une base scientifique et d'occuper des postes de direction de premier plan.
- Une compréhension de la culture d'entreprise et des responsabilités dans les différents domaines de la gestion d'entreprise
- Une compréhension approfondie des domaines des affaires et de la gestion
MODULES DE BASE
Cette section fournit des détails sur la structure, le contenu et les acquis d'apprentissage de tous les modules de cette qualification.
TRAVAILLER AVEC DES DONNÉES
Descriptif des modules
Ce module inculque une compréhension pratique et un cadre qui permet l'exécution d'actions d'analyse essentielles telles que l'extraction, le nettoyage, la modification et l'analyse des données. Dans ce module, les apprenants acquièrent la connaissance des langages de programmation, des outils, des frameworks et des bibliothèques utilisés tout au long du cours pour acquérir et modéliser des ensembles de données. L'analyse des données s'effectue en visualisant, en résumant et en développant des capacités rudimentaires de traitement des données en prêtant attention aux types, noms et valeurs de variables. De plus, la gestion des données à l'aide de dates, de chaînes et d'autres éléments améliore les capacités des apprenants à effectuer des recherches de données et à générer des visualisations.
Résultats d'apprentissage
L01 : Analyser les informations à l'aide d'outils de visualisation, de synthèse et de comptage des données.
L2 : Acquérir des compétences rudimentaires en matière de traitement des données, en se concentrant sur les types de variables, les noms et les valeurs.
L03 : Apprendre à utiliser le canalisateur pour combiner de nombreuses opérations de rangement en chaîne.
L04 : la possibilité de travailler avec des données comprenant des dates, des chaînes et d'autres variables
Contenu couvert
- Techniques de nettoyage des données
- Prétraitement des données
- Manipulation de données
- Programmation Python de base
- Visualisation des données à l'aide de Matplotlib
- Algèbre linéaire
- Statistiques et probabilités
- L'analyse exploratoire des données
- Variance, écart type, médiane
- Graphiques à barres et graphiques linéaires
- Bibliothèques et framework Python pour l'analyse de données
- Nuage de points 2D
- Nuage de points 3D
- Parcelles en paires
- Univarié, bivarié et multivarié
- Histogrammes
- Boîte à moustaches
- IQR (intervalle interquartile)
- Analyse de données avec Pandas
ANALYSE DES DONNÉES DANS LES PROCESSUS COMMERCIAUX
Description du module
Ce module aborde les principes de création de modèles de feuilles de calcul fiables, de traduction de modèles conceptuels en modèles mathématiques et de leur application dans des feuilles de calcul. Il démontre également une connaissance de trois outils d'analyse dans Excel, des fonctions Excel et du processus d'audit des modèles de feuilles de calcul pour garantir l'exactitude. Sont également abordés dans ce module
Analyse des décisions, tableaux de gains et arbres de décision. Microsoft Power BI aide les utilisateurs à tirer des connaissances pratiques des données pour résoudre les problèmes commerciaux, en apportant des modèles analytiques à la prise de décision de l'entreprise. Les apprenants acquièrent un aperçu des fonctionnalités analytiques avancées de Power BI, telles que la prédiction, les visualisations de données et les expressions d'analyse de données.
Résultats d'apprentissage
LO1 : Analyser de manière critique l'utilisation des données d'entreprise dans un contexte de prise de décision organisationnelle.
LO2 : Démontrer une compréhension critique des principes d’analyse commerciale dans les fonctions de gestion.
LO3 : Appliquer des techniques appropriées de gestion et d'analyse des données pour récupérer, organiser et manipuler les données.
LO4 : Appliquer des méthodes d'analyse de données statistiques et des techniques de visualisation appropriées pour prendre des décisions commerciales judicieuses.
Contenu couvert
- Création de modèles de feuilles de calcul
- Analyse de simulation
- Fonctions de modélisation
- Modèles de feuilles de calcul d'audit
- Modèles de feuilles de calcul prédictifs et prescriptifs
- Identification du problème
- Analyse des décisions
- Analyse de décision avec ou sans probabilités
- Calcul des probabilités de branche
- Théorie de l'utilité
- Streaming de données dans Power BI
- Visualisation dans Power BI
- Expressions d'analyse de données
- Vues de rapport dans PowerBI
- Tri des données
- Transformation des données
- Filtrage des données
- Éditeur Power Query
- Analyse de risque
- Analyse de sensibilité
TECHNIQUES D'EXPLORATION DE DONNÉES
Description du module
Le processus d'exploration de données comprend la collecte des informations nécessaires à partir d'énormes bases de données qui aident à prendre une décision éclairée. Le module présente des techniques d'exploration de données telles que le traitement des données, la découverte de modèles et les tendances de l'information. Ces méthodes sont utilisées pour acquérir les compétences et les capacités nécessaires pour appliquer l'intégration, le nettoyage, la sélection et la transformation de données sur des tableaux et des graphiques pour la découverte de connaissances. Les bibliothèques matricielles Python permettent aux apprenants de construire une représentation réaliste de l'exploration de texte en exécutant des tâches telles que la classification, l'estimation, la segmentation, la prévision, la séquence et l'association de données.
Résultats d'apprentissage
LO1 : Comprendre les principes fondamentaux de l'exploration et de l'analyse de texte, notamment l'identification de modèles intéressants, l'extraction de connaissances utiles et l'aide à la prise de décision.
LO2 : Explorez les principes fondamentaux de l'exploration de texte et les algorithmes essentiels ainsi que certaines de leurs applications pratiques.
LO3 : Être capable d'appliquer les connaissances et compétences acquises pour mettre en œuvre des techniques de découverte de modèles évolutives sur de grands volumes de données transactionnelles.
LO4 : S'engager dans des discussions significatives sur les mesures d'évaluation des modèles et étudier les techniques d'exploration de divers modèles, y compris les modèles séquentiels et sous-graphiques.
Contenu couvert
- Introduction à l'exploration de données
- Exploration de données dans un environnement basé sur Python
- Qu'est-ce qu'un entrepôt de données
- Comment trouver des modèles ?
- Analyse d'affinité
- Recommandation de produit
- Introduction à l'exploration de bases de données
- Bases de données et SQL
- DDL, DML, jointures et schémas
- Comment utiliser les bibliothèques matricielles Python sur des ensembles de données.
- Charger l'ensemble de données avec NumPy
- Représentations de données adaptées au minage
- Représentation textuelle pour l'exploration de données.
- Pourquoi le texte est-il complexe ?
- Exploration de texte
- Modélisation, évaluation et déploiement de données dans l'exploration de texte
- Exemples de techniques : représentation d'un sac de mots dans Text Mining
- Exploration fréquente de sous-graphes
ALGORITHMES EN SCIENCE DES DONNÉES
Description du module
Ce module fournit des connaissances approfondies sur la répartition des données en formation, validation et création d'ensembles de tests. Développer et évaluer des modèles d’exploitation minière prédictive en intégrant un cadre et une perception pratique. De nombreuses mesures de performance sont présentées pour les systèmes d’estimation et de catégorisation. Les approches de modélisation prédictive les plus répandues, notamment les réseaux de neurones artificiels, les machines à vecteurs de support, le k-voisin le plus proche, l'apprentissage bayésien, les modèles d'ensemble et différents arbres de décision, sont examinées dans ce module et fournissent des résultats.
Résultats d'apprentissage
LO1 : Présenter les concepts algorithmiques fondamentaux, notamment le tri et la recherche, diviser pour régner et les algorithmes complexes.
LO2 : trier les données et les utiliser pour la recherche ; décomposer un énorme problème en problèmes plus petits et y répondre de manière récursive ; appliquer la programmation dynamique à la recherche génomique ; et plus.
LO3 : Discuter et construire les structures de données les plus souvent utilisées pour l'informatique moderne LO4 : Être capable d'utiliser les structures de données les plus utilisées par l'industrie dans l'informatique moderne
Contenu couvert
- Méthode d'exclusion statique
- Validation croisée k-Fold
- Données déséquilibrées de classe
- Évaluation de la classification des résultats catégoriels
- Évaluation de l'estimation des résultats continus
- Régression logistique
- K-voisin le plus proche
- Méthode du voisin le plus proche pour la prédiction
- Arbre de classification et de régression
- Machines à vecteurs de support
- Approche basée sur les processus pour l’utilisation de SVM
- Méthodes Bayes naïves
- Réseaux bayésiens
- Architectures de réseaux neuronaux
- Modélisation d'ensemble
MODULES DE SPÉCIALISATION
Cette section fournit des détails sur la structure, le contenu et les résultats d'apprentissage des Pathways de spécialisation.
MODÉLISATION DES DONNÉES STATISTIQUES
Description du cours
Ce module donne aux apprenants les moyens d'appliquer de nombreux modèles de prédiction et d'appréhender la régression linéaire. Créez des prédictions basées sur un groupe de variables d'entrée à l'aide de méthodes d'analyse de régression. Les apprenants étudient la manière de modéliser une large gamme d'interactions du monde réel à l'aide de méthodologies statistiques complexes, telles que des modèles linéaires et additifs généralisés. Ce module inculque des méthodologies de modélisation statistique intermédiaires et avancées. Il est spécifiquement créé pour que les apprenants développent leurs compétences en analyse de régression linéaire, en conception expérimentale et en modèles linéaires et additifs étendus. Sur la base de ces compétences, l'interprétation des données, la découverte de liens entre les variables et la génération de prédictions sont simplifiées grâce à des représentations intuitives.
Résultats d'apprentissage
LO1 : Différencier les différents types de modèles prédictifs et la régression linéaire principale
LO2 : Comprendre le fonctionnement interne grâce aux algorithmes de différents modèles
LO3 : Analyser et explorer les résultats de la régression logistique et comprendre quand procéder à une analyse discriminante
LO4 : Maximiser la productivité analytique en analysant différents modèles et en interprétant leur précision de manière bien organisée
Contenu couvert
- Sélection d'un échantillon
- Estimation des points
- Distributions d'échantillonnage
- Estimation d'intervalle
- Tests d'hypothèse
- Inférence statistique et signification pratique
- Un modèle de régression linéaire simple
- Méthode des moindres carrés
- Inférence et régression
- Modèle de régression multiple
- Régression logistique
- Prédictions avec régression
- Ajustement du modèle
- Modèle de données Tableau
- Transformation de formes et de données à l'aide de Tableau Query Editor
- Vue du rapport Tableau
Applications des données en intelligence artificielle et blockchain
Description du cours
Dans ce module, les apprenants appréhenderont mieux les applications de l'intelligence artificielle (IA) en entreprise et comprendront la prise de décision par l'IA. Grâce aux percées de l'IoT et à l'émergence de la Blockchain, ce programme prépare les étudiants à une large base de solutions logicielles basées sur l'IA. Au fur et à mesure que les apprenants progressent dans ce module, ils se familiarisent avec la technologie qui alimente le monde automatisé, connaissant les types d'algorithmes et comment ils peuvent être utilisés pour améliorer ou reproduire le comportement humain dans diverses applications. Ce module enseigne les composants de l'IA, de l'IoT, de la Blockchain et de l'apprentissage automatique tout en s'appuyant sur un cadre conceptuel solide qui présentera des moyens rigoureux, pratiques et étape par étape pour relever des défis réalistes et complexes du monde réel.
Résultats d'apprentissage
LO1. Présentation de l'intelligence artificielle (IA), explorant ses fonctionnalités et variantes dans le domaine des affaires. De plus, comprendre le contexte commercial de l’IA et interpréter la prise de décision en matière d’IA.
LO2. Comprendre et créer un plan de mise en œuvre de l'IA pour une configuration commerciale grâce à la reconnaissance des paramètres de modèle appropriés
LO3 : Explorer davantage les composants de la Blockchain et comprendre le concept, les fonctionnalités, les avantages et la pertinence de la technologie du grand livre distribué (DLT) dans l'application.
LO4 : Comprendre Hyperledger, les contrats intelligents et l'IoT (Internet des objets) dans les modèles économiques appliqués pour évaluer l'impact à long terme
Contenu couvert
- Introduction à l'intelligence artificielle
- L'IA permet aux applications
- Qu'est-ce que l'apprentissage profond
- Réseaux de neurones artificiels
- Traitement d'images et OpenCV
- Introduction à la PNL
- Réseaux de neurones artificiels
- Traitement de texte
- Classement du texte
- Modélisation de sujets
- Réseaux de neurones récurrents
- Principaux composants de l'IoT
- Variété de capteurs
- Actionneurs
- Protocoles IoT à différentes couches
- Applications et interface utilisateur dans l'IoT
- Les usines intelligentes de demain et l’Internet industriel des objets
- Introduction aux blockchains
- Introduction et utilisation d'Hyperledger et de Smart Contract
- Structure des chaînes de blocs
- Systèmes centralisés, décentralisés et distribués
- Introduction au DLT
- Fonctionnalités, avantages et utilisation du DLT dans Blockchain
- Types de blockchains
- Pourquoi la Blockchain ?
- Créer des applications d'IA et de ML à l'aide de la technologie Blockchain
PARTIE 2 : Projet Capstone
Description des modules :
Le but de ce module est de discuter et d'expliquer le rôle de la science des données et ses pratiques dans une organisation et leur influence sur la performance globale et la compétence de l'organisation. Ce module est conçu pour développer une compréhension des pratiques contemporaines et des compétences pour développer une question de recherche ou de conception, illustrer comment elle est liée aux connaissances actuelles et mener l'étude de manière systématique. Les apprenants seront encouragés à choisir un projet de recherche/développement qui reflète leurs apprentissages antérieurs dans le domaine de la science des données. Il vise à acquérir une compréhension de la science des données et du changement de paradigme dans les approches et méthodes liées à diverses fonctions de DS telles que la visualisation des données, les probabilités, l'inférence et la modélisation, l'exploration de données, l'organisation des données, la régression et l'apprentissage automatique, pour n'en nommer que quelques-unes. . Il s'efforce également de mettre en évidence le rôle et l'importance de l'analyse et de la modélisation des données lors de la planification, de la prise de décision et de la mise en œuvre du changement dans l'organisation. Après avoir terminé avec succès le module, les participants auront une connaissance approfondie du contexte plus large de l'analyse de données et d'un produit de données pour démontrer leur expertise en science des données à des employeurs potentiels ou à des programmes de formation.
Résultats d'apprentissage
LO1 : Mener une recherche et un développement indépendants dans le contexte d'un projet de science des données
LO2 : Développer la capacité à résoudre des problèmes de manière indépendante en utilisant l'analyse et la science des données
LO3 : Communiquer des informations techniques de manière claire et succincte à un large public non spécialisé.
LO4 : Créer une documentation écrite détaillée selon les normes attendues d'un professionnel dans le domaine de la science des données et évaluer les résultats du projet en référence aux publications de recherche clés dans le domaine concerné.
APERÇU DES QUALIFICATIONS
Titre du prix : Diplôme étendu PG en science des données (120 crédits)
Pour obtenir le diplôme de troisième cycle étendu de niveau 7 en science des données, les apprenants doivent suivre les quatre modules de la section CORE (80 crédits) et deux modules de la spécialisation choisie Pathway (40 crédits)
Section centrale
La section principale de ce diplôme PG Extended Diploma contient quatre modules obligatoires.
- Travailler avec des données (20 crédits)
- Analyse de données dans les processus commerciaux (20 crédits)
- Techniques d'exploration de données (20 crédits)
- Algorithmes en science des données (20 crédits)
Spécialisation Pathways
Le PG Extended Diploma in Data Science comporte deux spécialisations Pathways .
- Modélisation des données statistiques
- Applications des données dans l'intelligence artificielle et la blockchain
Opportunités de progression
Les apprenants qui obtiennent le diplôme étendu PG en science des données pourraient progresser vers : -
- Master en sciences des données
- M.Sc. en Big Data


