Conception d'un datawarehouse universitaires

Fermé
kyudo1 Messages postés 5 Date d'inscription jeudi 26 août 2010 Statut Membre Dernière intervention 30 août 2010 - 26 août 2010 à 10:59
kyudo1 Messages postés 5 Date d'inscription jeudi 26 août 2010 Statut Membre Dernière intervention 30 août 2010 - 30 août 2010 à 02:01
Bonjour à tous,

je suis nouveau sur le forum et j'espère que vous pourrez m'aider.

J'ai actuellement comme projet de concevoir un datawarehouse permettant d'exploiter les résultats des étudiants d'une université.
comme source de donnée j'ai plusieurs fichiers excel, chacun sous un format différents "ca aurait été trop beau qu'il ait le même " que j'ai décidé de transformer en utilisant Talend, jusque là pas globalement pas de soucis.
Le problème c'est que je ne vois pas trop ce que j'aurai comme dimensions ni comme mesures.
un étudiant peut avoir étudié plusieurs années deug, licence, M1, M2.
chaque année est composée de modules et chaque modules de matières. pour chaque module et matières on a un coefficient. un étudiant peut avoir réussi une matière en première session ou l'a repassé en deuxième session. et peut être déficient à cette matière et devoir la repassé l'année suivante.
j'avais décidé d'avoir:

une dimensions années contenant l'année étudiée ,le semestre et la session.
une dimension étudiant contenant le nom et prénom
une dimension module contenant le nom du module et son coefficient
une dimension matières contenant le nom de la matière et son coefficient.
et comme mesure la note mais j'ai quelques problèmes sur ça.

pour certaines matières je n'ai pas de notes mais pour le module auquel elle appartient j'en ai une. donc est ce que je peux laissé une matière sans note. est ce qu'une valeur nulle est possible dans un datawarehouse.
dans le cas ou c'est possible je devrais alors rajouter comme mesure la note du module car j'avais initialement pensé à la calculer via le notes des matières et leurs coefficients.
La cerise sur le gâteau est que pour certain module je n'ai pas la note et non plus des matières le composant et donc je ne peux pas calculer le résultat final de l'étudiant, et donc est ce que je dois rajouter comme mesure le résultat de l'étudiant, si il a réussi son année et aussi est ce que je dois aussi rajouter par exemple la mention...
car en analysant les fichiers j'ai vu que d'une année à une autre les mentions pour une moyenne changé et donc je ne pourrai pas le calculé

J'avouerai que je n'ai pas d'expérience de conception d'un datawarehouse et que je suis un peu perdu.
Sur ce projet on doit déterminé les dimensions et mesures, svp quelqu'un pourrait-il m'aiguiller, me confirmer si globalement c'est bon ou me contredir.
et surtt est ce qu'une valeur nulle est possible dans un entrepot de donnée?

Je vous remercie infiniment d'avance pour toutes vos réponses et l'aide que vous m'apporterez.
A voir également:

8 réponses

moderno31 Messages postés 870 Date d'inscription mardi 23 juin 2009 Statut Membre Dernière intervention 8 août 2012 92
26 août 2010 à 14:47
tu as un message privé..
1
moderno31 Messages postés 870 Date d'inscription mardi 23 juin 2009 Statut Membre Dernière intervention 8 août 2012 92
26 août 2010 à 14:12
Lol, je suis spécialite en B.I je peux t'aider oui.
Ton sujet est assez large et recoupe pas mal de besoins que visibilement tu n'as pas encore bien identifié.

Question à se poser :
Le fait de monter un DWH consiste à obtenir, analyser et à restituer quoi comme info exactement ?
C'est en fonction du niveau de besoin, du degré de difficulté d'accès aus données (via modèle de données de prod ou agreggé) que tu pourras déterminer les axes d'analyse dont tu as besoin. Alors c'est vrai, un conseil, avant de chercher les dimensions, détermine les mesures ou indicateurs que tu auras besoin.

En regard de ça, tu pourras définir les dimensions appropriées.
0
kyudo1 Messages postés 5 Date d'inscription jeudi 26 août 2010 Statut Membre Dernière intervention 30 août 2010
26 août 2010 à 14:24
Merci pour ta réponse

le but final de l'entrepôt sera d'analyser les résultats en passant par un outil de datamining en utiliseant 2 méthodes : les K-means et Arbres de décision. pour trouver des groupes d'étudiants ayant des résultats similaires. et pour trouver les matières proches qui permettraient de constituer des modules homogènes.
en fonction de ces résultats que je dois analyser, je dois avoir un niveau de granularité assez fine je pense.
je n'ai pas à me préoccuper des problèmes d'alimentation de l'entrepot et de son actualisation car ca sera fait une fois pour toutes avec les fichiers que j'ai.

peux-tu m'aiguiller un peu plus stp sur comment est ce que je dois procéder?
0
moderno31 Messages postés 870 Date d'inscription mardi 23 juin 2009 Statut Membre Dernière intervention 8 août 2012 92
26 août 2010 à 14:49
par contre pour ce qui est de tes questions directe il faut procéder dans l'ordre, donc tu en es à quel stade ?
Expression de besoin, exploration des données? Paramétrage technique ?
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
kyudo1 Messages postés 5 Date d'inscription jeudi 26 août 2010 Statut Membre Dernière intervention 30 août 2010
28 août 2010 à 12:27
Bonjour a tous

je reviens avec une nouvelle question, je voudrais savoir est ce qu'il est possible d'avoir des mesures hiérarchique.
tout comme cela est possible dans les dimensions
année<-semestre<-mois<-...
je voudrais la meme chose pour les mesures:
moyenne annuelle<-moyenne semestriel<-....

comme ca quand je fais un roll-up j'obtient directement la mesure correspondante et non l'aggrégation d'une mesure précise.
0
kyudo1 Messages postés 5 Date d'inscription jeudi 26 août 2010 Statut Membre Dernière intervention 30 août 2010
28 août 2010 à 16:34
Bonjour je me pose une autre question

est ce qu'il est possible pour la dimension temps de la séparé en année et semestre avec comme format

année 05/06
semestre 1 ou 2?

car j'ai à gérer des années scolaires et ce format et plus logique que d'avoir le format standart.
est ce que c'est possible sur cognos et est ce que je dois obligatoirement avoir cette dimension comme dimension temps?

je vous remercie infiniment pour vos réponses

et bn week end à tous
0
moderno31 Messages postés 870 Date d'inscription mardi 23 juin 2009 Statut Membre Dernière intervention 8 août 2012 92
29 août 2010 à 22:27
On va dire que ta date quelque soit son format te permettra ensuite de faire un découpage avec les fonctions date intégrées aux SGBD courants.
Pour année -->table année_scolaire 2005/2006 = ID 8 (exemple)
les correspondances dans une table session_detail : année 2005; ID de mois sept à décembre puis toujours pour l'ID 8 tu aurais les autres mois correspondants à 2006.

0
kyudo1 Messages postés 5 Date d'inscription jeudi 26 août 2010 Statut Membre Dernière intervention 30 août 2010
30 août 2010 à 02:01
Bonsoir
c'est vrai ue vu sous cet angle ca parrait logique. le seul hic c'est que je n'ai aucune date d'examen. je sais que le module a été étudié en premier semestre et que donc l'examen a été pendant le premiere semestre mais je ne peux obtenir la date réelle. est ce que je dois donc en inventer une dans la bonne période??
Merci à tous et bonne soirée
0