University of California, Irvine - Division of Continuing Education
Programme de certificat accéléré: science des données
Irvine, États-Unis d'Amérique
Certificat
DURÉE
3 mois
LANGUES
Anglais
RYTHME
À plein temps
DATE LIMITE D'INSCRIPTION
DATE DE DÉBUT AU PLUS TÔT
30 Mar 2026
FRAIS DE SCOLARITÉ
USD 7 900 *
FORMAT D'ÉTUDE
Sur le campus
* coût total approximatif : 14 100 $ USD, hors billets d'avion ; frais de stage : 2 900 $
Aperçu
La science des données est continuellement classée parmi les professions les plus demandées. Le besoin de professionnels capables de gérer et d'exploiter les informations à partir des données est plus clair que jamais. Le programme enseigné dans ce programme est conçu pour répondre aux besoins multidisciplinaires croissants des professionnels des données. En couvrant un large éventail de sujets, le programme aborde la grande variété de compétences nécessaires pour travailler sur des projets basés sur des données réussis. Les sujets abordés incluent la découverte et la prédiction basées sur les données, l'ingénierie des données à grande échelle (inspection, nettoyage, transformation et modélisation des données), les données structurées et non structurées, les statistiques de calcul, la reconnaissance de formes, l'exploration de données, la visualisation de données, les bases de données, SQL, la programmation Python, et l'apprentissage automatique.
Le programme de certificat accéléré (ACP) de niveau post-universitaire de 3 mois d'UC Irvine en science des données couvre un large éventail de sujets en science des données, y compris la découverte et la prédiction basées sur les données, l'ingénierie des données à grande échelle (inspection, nettoyage, transformation et modélisation des données) , données structurées et non structurées, statistiques de calcul, reconnaissance de formes, exploration de données, visualisation de données, bases de données, SQL, Python et apprentissage automatique.
Avantages
- Utilisez des techniques techniques pour fournir des informations et des renseignements commerciaux.
- Appliquer des concepts mathématiques, y compris la probabilité, l'inférence et la modélisation à l'application de projet de données pratique.
- Décrivez et utilisez les outils et technologies standard de l'industrie nécessaires pour modéliser et analyser de grands ensembles de données.
- Utilisez l'approche de modélisation des données pour prendre une décision commerciale optimale.
- Mettez en œuvre des algorithmes d'apprentissage automatique.
- Appliquez des outils d'analyse de texte à des ensembles de données non structurés et structurés.
- Développer et mettre en œuvre un plan d'entrepôt de données.
- Obtenez un avantage concurrentiel sur le marché du travail mondial grâce à un stage dans une entreprise américaine.
Conditions de certificat
Pour obtenir un certificat à l'UC Irvine Division of Continuing Education, les étudiants doivent suivre tous les cours requis avec une note égale ou supérieure à "C".
Des stages
En tant que dernier cours optionnel et moyennant des frais supplémentaires de 2900 $, vous avez la possibilité d'appliquer la théorie académique et d'acquérir une expérience pratique dans une variété d'entreprises et d'industries pendant 10 semaines. Un projet de recherche offre une formation supplémentaire. Les ateliers sur l'élaboration de CV et les techniques d'entrevue sont également inclus dans le stage.
Programme
Les étudiants seront placés dans un horaire du matin (9: 00-12: 00) ou de l'après-midi (13: 00-16: 00). Les cours du programme sont suivis consécutivement, en terminant un avant de passer au suivant. Les horaires ne sont pas garantis et sont sujets à changement. Un calendrier définitif sera fourni le premier jour du programme.
Curriculum
Mathématiques et statistiques pratiques pour la science des données
Les mathématiques pratiques et les statistiques sont à la base des domaines de la science des données et de l'analyse prédictive. Les statistiques sont utilisées dans tous les domaines du traitement des données commerciales, scientifiques et institutionnelles. Ce cours couvre les compétences statistiques fondamentales nécessaires à la science des données et à l'analyse prédictive. Il s'agit d'un cours axé sur l'application et l'approche est pratique. Les étudiants examineront plusieurs techniques statistiques et discuteront des situations dans lesquelles on utiliserait chaque technique, des hypothèses faites par chaque méthode, de la façon de mettre en place l'analyse, ainsi que de la façon d'interpréter les résultats. Ce cours commence par une introduction à l'analyse des données. Ensuite, le cours couvre les concepts fondamentaux des statistiques descriptives, des probabilités et des statistiques inférentielles, qui incluent le théorème central limite et les tests d'hypothèses. À partir de là, le cours se concentrera sur divers tests statistiques, y compris le test d'indépendance du chi carré, les tests t, la corrélation, l'ANOVA, la régression linéaire, les séries chronologiques et l'application de techniques précédemment apprises dans de nouvelles situations.
Introduction à la programmation Python
Introduction à Python est une introduction pour débutant à la programmation à l'aide de Python. Ce cours est conçu pour ceux qui n'ont aucune expérience en programmation et n'ont pas de formation technique. C'est pour ceux qui veulent une introduction en douceur. Après ce cours, les étudiants peuvent vouloir suivre un cours Python plus intermédiaire ou avancé. Ou, ils peuvent se sentir suffisamment en confiance pour commencer à apprendre par eux-mêmes. Si vous n'avez pas de formation en Python, mais que vous avez une bonne formation en Java, C ou un autre langage, ce cours pourrait vous sembler lent. Les étudiants apprendront ce qui suit : comment utiliser les types de variables, le contrôle de flux et les fonctions, comment interagir avec le système via Python, comment écrire des scripts simples pour traiter du texte et comment utiliser Jupyter, un outil de développement populaire pour Python.
Fondamentaux de la science des données
L'objectif de ce cours est de démystifier la science des données et de familiariser les étudiants avec les compétences, techniques et concepts clés des scientifiques des données. En commençant par des concepts fondamentaux tels que la taxonomie analytique, le processus standard interindustriel pour l'exploration de données et le diagnostic des données, le cours passera ensuite à la comparaison de la science des données avec les techniques statistiques classiques. Un aperçu des techniques les plus couramment utilisées en science des données, y compris l'analyse des données, la modélisation statistique, l'ingénierie des données, les bases de données relationnelles, SQL et NoSQL, la manipulation de données à grande échelle (big data), les algorithmes d'exploration de données, la qualité des données, la remédiation et les opérations de cohérence seront couvertes.
Ingénierie des données
Ce cours est conçu pour améliorer les compétences des étudiants en matière de conception de données, de gestion de données, d'entrepôt de données, de modélisation de données et de manipulation de requêtes. Les sujets incluent des techniques et des méthodes d'identification, d'extraction et de préparation de données pour le traitement avec un logiciel de base de données. Obtenez un aperçu des techniques de base de l'ingénierie des données, y compris la normalisation des données, l'ingénierie des données, les bases de données relationnelles et non relationnelles, SQL et NoSQL, la manipulation des données à grande échelle (big data), les algorithmes pour les opérations de données. Les étudiants travailleront en équipe sur un projet final pour explorer, analyser, résumer et présenter les résultats dans un ensemble de données volumineuses du monde réel.
Visualisation avancée
La visualisation joue un rôle fondamental dans la compréhension des propriétés et des relations dans les données pour extraire des informations et communiquer les résultats. Que l'analyse soit descriptive, diagnostique, prescriptive ou proscriptive, la visualisation est essentielle tout au long de tout cycle d'analyse. Ce cours se concentrera sur l'application de diverses méthodes et techniques à différentes étapes du cycle d'analyse, telles que la préparation des données, la modélisation et la création de rapports. Les étudiants apprendront des techniques de visualisation de données univariées, multivariées, temporelles, textuelles, hiérarchiques et basées sur des réseaux / graphiques, à la fois dans l'analyse ad hoc et dans la génération automatisée.
Analyse de données volumineuses
Les entreprises utilisent des technologies telles que MapReduce, Hadoop, Yarn et Apache Spark pour extraire la valeur du Big Data. Ce cours fournit une vue d'ensemble approfondie de Hadoop et de Spark, les pierres angulaires du traitement du Big Data. Pour cristalliser les concepts derrière Hadoop et Spark, les étudiants travailleront sur une série d'exercices courts et ciblés. Les concepts abordés incluent l'architecture Hadoop, Apache Spark Big Data Framework, l'ingestion de données, le traitement distribué et la programmation fonctionnelle. De plus, les étudiants apprendront à configurer et à installer un cluster Hadoop, à écrire des programmes MapReduce de base, à utiliser des pratiques de programmation MapReduce avancées et à utiliser des interfaces telles que Pig et Hive pour interagir avec Hadoop.
Qui devrait être présent
Ce programme est destiné aux professionnels de divers secteurs et fonctions qui cherchent à aider leur organisation à comprendre et à exploiter les quantités massives de données diverses qu'ils collectent. D'autres qui bénéficieraient de ce programme comprennent les ingénieurs de données, les analystes de données, les informaticiens, les analystes commerciaux, les administrateurs de bases de données, les chercheurs et les statisticiens.


