Ville : Paris
Université : POLYTECHNIQUE / PARIS SACLAY
Responsable : Erwan le Pennec, Eric Moulines
Mode d’enseignement : présentiel
Site internet : https://datascience-x-master-paris-saclay.fr/
Contact : michel.gesbert@polytechnique.edu

Description :

Les grands acteurs du monde économique ont aujourd’hui une conscience de plus en plus précises du potentiel que recèlent leurs données et recherche les moyens d’exploiter et d’en tirer le maximum d’informations utiles. Pour les aider dans cette tâche, les datascientists (littéralement les scientifiques des données) sont les personnes en charge de récupérer, stocker, organiser, traiter cette masse d’informations afin d’en tirer de la valeur.

Le datascientist est un profit d’un genre nouveau, issu de la convergence des statistiques et de l’informatique. Donner une définition précise de ce que recouvre le mot datascientist reste une gageure. Ce qui le caractérise certainement le mieux c’est la variété des compétences qu’il doit maîtriser. Il s’agit d’un profil hybride, qui doit disposer d’un solide bagage en mathématiques, statistiques mais aussi maîtriser les outils informatiques ou les infrastructures nécessaires à la gestion et au traitement des données. Il doit avoir la curiosité et la soif de comprendre le métier de secteur dans lequel il intervient. L’objectif de ce master est de vous préparer à devenir les datascientists de demain aussi bien dans le monde académique que dans le monde industriel. Une grande partie de nos étudiants choisit d’ailleurs de faire un doctorat.

Objectifs :

L’objectif de formation est aussi bien la poursuite en doctorat que le début d’une carrière de datascientists.

Prérequis

Programming skills

• Some experience with programming : master the fundamental constructs of a programming language (like Python, Java or C++) including

  • Basic syntax and semantics of a higher-level language
  • Variables and primitive data types (e.g. numbers, characters, Booleans)
  • Expressions and assignments
  • Simple I/O including file I/O
  • Conditional and iterative control structures
  • Functions and parameters passing
  • The concept of recursion

The students must be able to analyze and explain the behavior of simple programs involving the fundamental programming constructs variables, expressions, assignments, I/O, control constructs, parameter passing and recursion. The students must identify and describe the use of primitive data types and write programs that use primitive data types. The students must know how to design, modify, expand, short programs that use standard conditional and iterative control structures and functions. The students must know how to test, and debug a program that uses the following fundamental programming constructs: basic computation, simple I/O, standard conditional and iterative structures, the definition of functions, and parameter passing.

• A basic understanding of fundamental data structures is also required:

  • arrays,
  • records/structs (heterogeneous aggregates),
  • string and string processing,
  • abstract data types and their implementations (stacks, queues, priority queues, sets,
  • maps)

The students must know when and how using appropriate built-in data-structures. Students must understand common applications of stack,,,, queue, priority queue. The students must know how to write short programs that use each of the following data structure: arrays, records/structs, strings, linked lists, stacks, queues, sets, and maps. The students must know how to compare alternative implementations of data structures with respect to performance and to choose appropriate data structure for modeling a given problem

• Some familiarity with more advanced programming structure is a bonus but is not required.

Linear Algebra
  • Linear Equations
    • Gaussian Elimination and Matrices ,
    • Gauss–Jordan Method,
    • Rectangular Systems and Echelon Forms .
  • Matrix Algebra
    • Addition, multiplication, transposition,
    • Properties of Matrix Multiplication,
    • Matrix Inversion,
    • The LU and QR factorizations.
  • Vector Spaces
    • Spaces and Subspaces,
    • linear independence,
    • Basis and Dimension.
  • Norms, Inner Products, and Orthogonality :
    • Vector Norms, Matrix Norms,
    • Inner-Product Spaces, Orthogonal Vectors, Gram–Schmidt Procedure,
    • Unitary and Orthogonal Matrices, Range-Nullspace Decomposition,
    • Orthogonal Decomposition, orthogonal basis,
    • Singular Value Decomposition .
  • Eigenvalues and Eigenvectors :
    • Elementary Properties of Eigensystems,
    • Diagonalization by Similarity Transformations ,
    • Functions of Diagonalizable Matrices,
    • Positive Definite Matrices, spectral theorems.

Recommended reading: Introduction to Linear Algebra, Gilbert Strang, MIT Press, 2009 (videolectures are available).