Archive de la catégorie «MIAME»

21 février 2008 – 19 février 2008 – MIAME, minimal information about a microarray experiment (suite)

février 21, 2008

11h00 :
Bon alors j’avais pas tout compris sur le MIAME, c’est plus important que je ne croyais puisqu’il faut avoir ces info pour publier

je vais donc reprendre les infos et voir ou je peux les trouver dans la base, voir les ajouter si besoin
il s’agit de la partie Experiment description, qui est finalement la plus importante puisque on peut retrouver celles de la puce relativement facilement, encore que je me demande si dans la base j’ai l’info donnant une référence de la puce, la référence…

Experiment description :

  1. Experimental design
    • Authors, laboratory and contact information –> j’ai deja une table technicians, mais je pense que la c’est un peu différent. je vais créer une table authors et une table location. la table technicians sera surement liée a authors. par contre pas la peine de demander déjà ces infos dans l’interface web de base
    • type of experiment : ex normal vs malade, traité vs non traité, cinétique… –> a voir s’il s’agit des info decrites dans la table experiment_type. peut-etre qu’on peut mettre plus d’info dans cette table
    • Number of hybridizations in the experiment –> cette info je l’ai en reprenant le nb de slides total je pense. il faut préciser cette info
    • Whether or not a common reference sample has been used –> a ajouter dans experiments, un booléen common_reference_sample fera l’affaire
    • Quality control steps : replication a différents niveau, inversion des couleurs, spots de control –> un long text pour ca me parait bien
    • Description of experiment and its goal –> un long text encore
    • links to journal and web/publication of the experiment –> je vais créer une table biblio, simpliste pour le moment, 3 colonnes, id, title et exp_id
    • journal or URL citations –> pareil, une table citation, identique a biblio
  2. Sample used, extract preparation and labelling
    • Biosource properties : c’est le terme décrivant l’organisme d’où provient l’échantillon qui sera hybridé –> unte table biosource me semble indispensable a ce stade
      • Organism : nom utilisé par la taxonomie de NCBI
      • contact details : personne a contacter pour avoir des info sur l’échantillon –> un lien vers authors me semble bien
      • Descriptors relevant to the sample –> une table sample_descriptor
        • sex : male, femelle, hermaphrodite
        • age : en heure, jour, mois, année… et depuis quelle moment (naissance, meiose…)
        • Developmental stage
        • organism part
        • cell type
        • Animal/plant strain or line
        • genetic variation: wild type, gene knockout ou tansgenic variation
        • individual genetic characteristic
        • additiobal clinical information
        • individual ID
    • Biomaterial manipulations : ce sont les process mis en oeuvre sur la
    • biosource dans le cadre de la manip –> une petite table encore

      • Growth conditions
      • in vivo treatments
      • in vitro treatments : conditions de culture
      • treatment type : drug, heat shock, food deprivation
      • separation technique : none, microdissection, FACS
    • Hybridation extract preparation protocol –> aller encore une table
      • Extraction method URL ou protocol -> une table extraction method bien sur
      • extract type
      • Amplification
    • Labeling protocol –> a voir ou ca se met, je ne sais pas tres bien
      • Amount of nucleic acid labelled
      • label used : A-Cy3, G-Cy5 ou 33P
      • label incorporation method –> table protocol. je vais faire une table biblio globale et des sous-tables pour chaque type de protocoles
    • External controls added to hybridization extract
      • element on array expected to hybridise to spiking control
      • spike type oligonucleotide ou ADN bacterien
      • spike qualifier
  3. Hybridisation procedure and parameters
    • Information about which labelled extracts have been hybridised to which arrays
    • Hybridisation protocol
      • the solution : concentration Na+ ou formamide
      • blocking agent : COTI
      • wash procedure : temperature et concentration en Na+
      • Quantity of labelled target used
      • Time, concentration, volume and temperature
      • Hybridization instruments : fabricant et modèle
  4. Measurement data and specifications of data processing
    • Raw data description
      • Scanning protocol : matériel, logiciel et paramètres --> une petite table pour ca
      • Scanned image –> pas tjs obligatoire mais bon, a mon avis il faut l’inclure, une petite base avec le nom de l’image et sa localisation sur le serveur ca serait bien
    • Image analysis and quantitation
      • image analysis software : specification et version du logiciel d’analyse d’image, l’agorithm et tous les paramètre (ca va faire pas malde données)–> encore une table
      • image analysis output : le fichier de sortie pour chaque image –> c le fichier gpr, une petite table pour ce fichier serait pas mal aussi.
    • Normalized and summarized data : matrice de donnée d’expression des gène
      • data processing protocol : détails sur la normalization –> a voir sous quelle forme mettre ca
      • Gene expression data tables
        • Derived measurements values : rassemble les réplicats et les valeurs associées a un meme gène
        • reliability indicator for each data point : ecart-type ou ecart à la médiane (pas essentiel mais important)

Cela fait pas mal de données a ajouter. en fait je pense que je vais faire bcp de tables individuelles et y faire référence dans des sous-tables.
peut-etre serait-il intéressant de faire l’interface en fonction de ces informations.

il semble que pour l’export d’information, le format MAGE-ML soit universellement reconnu. il me faudra donc surement prévoir l’export dans ce format.
GEO est un site regroupant les données d’expression. pour vouvoir y déposer les données il faudra les envoyer dans un format particuler. le MAGE-ML semble compatible avec ce site, ca me semble le bon choix –> le xml de toute façon c l’avenir

19 février 2008 – MIAME, minimal information about a microarray experiment

février 19, 2008

11h50 : lecture d’une partie du livre microarray bioinformatics (Steckel D.)
cette partie concerne les information minimale a récupérer pour pouvoir effectuer l’analyse d’une puce. je vais comparer ca avec la base de données crée hier (ici).
Le but de ce chapitre est de définir un certain nombre d’information permettant de reproduire n’importe quel expérience de puce dans n’importe quel labo.
–> c’est un peu différent de ce que j’imaginais.
il y a deux parties distinctes. la première décrit la puce en elle-meme et la seconde décrit l’expérience proprement dite.
3 termes sont définis :
-Feature : emplacement sur la puce contenant une séquence d’ADN, aussi appelé spot
-Reporter : séquence d’ADN sur la feature
-Composite sequence : gene ou séquence duquel dérive le reporter. il peut exister plusieurs reporter pour un même gène.

on trouve 7 types d’information :
1 – Informations liées à la puce :

  • array design name : nom unique donné a la puce
  • platform type: puce synthétisée in situ, spotted ou autre
  • surface and coating specification : composition physique de la puce et description de toute derivatisation chimique sur sa surface
  • physical dimensions of array : dimmension de la puce
  • number of features on the array : nombre de feature total ainsi que sur x et sur y et tout autre détail sur les grilles de la puce
  • availability: nom du fabriquant ou du fournisseur pour les puces commerciales et protocole de production pour les puces maisons

2- informations sur le type de reporter (pour chaque reporter) :

  • type of the reporter: oligo-nucleotides synthetiques, produits PCR, plasmides, colonies, autre
  • single or double stranded

3- informations sur le reporter (pour chaque reporter) :

  • sequence or PCR primer information :
    • sequence ou séquence de référence (i.e. oligonucleotides), si elle est connue
    • sequence accession number dans DDBJ/EMBL/GenBank, s’il existe
    • information sur les paires de primer, s’il y a lieu
  • exact or approximate length of the sequence : taille de la séquence si elle est connue
  • clone information : s’il y a lieu (clone ID, clone provider, date, availability)
  • element generation protocol : informations suffisantes pour reproduire l’élement sur une puce maison

4- informations sur le type de feature (pour chaque feature) :

  • dimensions : taille des features
  • attachment : liaison covalente/ionique/autre. s’il s’agit d’un oligonucleotide, indique si la liaison pronvient du 5′ ou du 3′ de l’oligo

5- informations sur la feature (pour chaque feature) :

  • Location on the array : coordonnées physique et logique
  • which reporter : reporter présent sur la feature

6- information sur les composite sequence (pour chaque composite sequence) :

  • which reporters it contains
  • the reference sequence
  • gene or EST names : nom des genes avec les liens vers les bases appropriées

7- références de la puce :

  • position of the feature : coordonnées logiques
  • control type : spiking, normalization, negative, positive
  • control qualifier : endogene, exogene

–>finalement je perds un peu mon temps a reprendre ca, je finirais plus tard.