Educatie - Genomics
Kleine verschillen met grote gevolgen
We beginnen dit hoofdstuk met een gedachtenexperiment. Stel dat je een draadje rond de wereld spant en strak aantrekt. Je hebt daarvoor een draad van 40.000 kilometer nodig. Stel nu dat je wilt zorgen dat het draadje nergens de wereld raakt, maar er overal net 1 cm boven hangt. Waarom doet er even niet toe. Hoeveel extra draad heb je nodig om die extra centimeter speling te bereiken?
Een eenvoudige berekening leert het volgende: de omtrek van een cirkel is 2pir. Je wilt de straal r met 1 centimeter vergroten en hebt dus 2pi centimeter oftewel 6.28 cm extra draad nodig om rond de hele wereld 1 cm speling te bereiken. Meer niet. Het lijkt vreemd, maar het is onweerlegbaar correct. Als je het niet gelooft, moet je het gedachten experiment eens met een kleine en een grote kubus doen.
Wat is 6.28 cm op 4 miljard cm? Wat is 1 DNA nucleotide op de 3 miljard nucleotiden in ons genoom. In beide gevallen kan het nogal wat uitmaken. In het geval van het touwtje kunnen de kevers overal ter wereld limbodansen. In het geval van DNA kan een enkele puntmutatie of single nucleotide polymorphism (SNP: zo heet een mutatie die bij meer dan 1% van de bevolking voorkomt) het verschil zijn tussen gezond en ziek, tussen leven en dood.
DNA
Matt Ridley vergelijkt het DNA met een boek in zijn boek ‘Genome’.[1]
“Imagine that the genome is a book. There are twenty-three chapters, called CHROMOSOMES. Each chapter contains several thousand stories, called GENES. Each story is made up of paragraphs, called EXONS, which are interrupted by advertisements called INTRONS. Each paragraph is made up of words, called CODONS. Each word is written in letters called BASES.
There are one billion words in the book, which makes it longer than 5,ooo volumes the size of this one, or as long as 8oo Bibles. If I read the genome out to you at the rate of one word per second for eight hours a day, it would take me a century. If I wrote out the human genome, one letter per millimetre, my text would be as long as the River Danube. This is a gigantic document, an immense book, a recipe of extravagant length, and it all fits inside the microscopic nucleus of a tiny cell that fits easily upon the head of a pin.” 
Watson en Crick hadden de prachtige symmetrische structuur van de DNA dubbele helix in 1953 opgehelderd. Door de juiste basen aan elkaar te paren omdat C en G drie waterstofbruggen en A en T twee waterstof-bruggen met elkaar te maken bleef er maar één oplossing over.
In slechts 999 woorden beschreven Watson en Crick de belangrijkste biomedische ontdekking van de twintigste eeuw.[2] Aan het eind geven ze aan dat de structuur ook replicatie en transcriptie (vermenigvuldiging), kan verklaren en zo leggen ze de basis voor de moleculaire biologie.
“It has not escaped our notice that the specific pairing we have postulated immediately suggests a possible copying mechanism for the genetic material.”[1]
De race
De echte moleculaire biologie startte pas toen Paul Berg in 1972 een stukje DNA in een ander stuk kon plaatsen, ofwel recombineren. In 1990 riep James Watson (ja, dezelfde) op tot het reusachtige humane genoom project. Een saai, traag project dat tot 2005 zou duren, werd in gang gezet door meerdere onderzoeksgroepen. Stukjes DNA van een chromosoom-deel werden bij elkaar geschraapt in een kunstmatig chromosoom (een YAC of een BAC), waarna weer kleine stukjes werden gemaakt om te sequencen. Als er voldoende kleine stukjes werden gesequenced, was er kans op overlap en had men een ‘contig’. Craig Venter stelde voor om gelijk alle chromosomen in kleine stukjes te sequencen en een zeer krachtige computer de boel aan elkaar te laten lijmen, de zogenaamde shotgun-methode. Hij werd uitgelachen, startte een bedrijf en had binnen een jaar de bacterie Haemophilus influenzae gesequenced en dit in het tijdschrift Science gepubliceerd. Wat een wraak. In 1998 deelde hij mee dat een nieuw bedrijf, Celera, het humane genoom niet 4-maal maar 10-maal ging sequencen en wel binnen 3 jaar. De grootste computer van de USA en honderden sequence-robots werden ingezet. Toen was de race echt begonnen en net voor het einde hebben Clinton en Blair wijselijk remise aangeboden. Beide partijen hadden gewonnen. Het publieke consortium publiceerde hun resultaat in Nature en Celera in Science om de competitie te benadrukken. Venter had natuurlijk een beetje vals gespeeld door alle informatie uit het publieke initiatief te gebruiken. De champagne knalde op 16 februari 2001. Maar er zitten natuurlijk nog veel fouten in, en er zijn grote stukken niet gesequenced. Grote delen van telomeren en centromeren (dus aan de buitenkant en aan de binnenkant) blijken lastig te kloneren.
Nu weten we alles

Figuur: van Matt Davies (http://cagle.slate.msn.com/news/gene/gene9.asp)
En nu weten we alles. We snappen opeens complex menselijk gedrag als:
- voorliefde voor soaps
- eindeloos kunnen praten over het weer
- te langzaam en te lang op de linkerbaan rijden
- voor de lol bungyjumpen en wildwaterkanovaren.
Of toch niet? Er is wel veel data gegenereerd, maar data is nog geen kennis. Data is een lange rij aaneengesloten letters.
Wezienwelallelettersmaarnietdewoordenenbegrijpenzekernietdetaal. Om nog maar niet te spreken over die lastige stukjes in DNA: introns en minisatellieten en repeats en junk etc.
Wiens genoom is het eigenlijk?
Wiens genoom is nu eigenlijk opgehelderd? Het genoom van Bill Gates, die 1 dollar per basepaar zou kunnen betalen? Er was een publiek initiatief waarbij uit 60 mannelijke donoren een anonieme selectie van 20 is gemaakt. Het DNA van deze 20 donoren is gepoold alvorens de sequentie op te helderen. Het is dus niet meer te achterhalen welke persoon bij welke sequentie hoort. Politieke correctheid leidde tot het weggooien van belangrijke gegevens. Als 1 van de donoren een ziekte had, zouden we dit kunnen koppelen aan zijn genoom. Dat kan nu helaas niet meer. Het private initiatief van Celera heeft 5 donoren gebruikt: 3 vrouwen en 2 mannen, allen van verschillend ras. Hoewel de vrouwen geen Y-chromosoom hebben, heeft men wijselijk besloten dat hun genoom extra informatie kan bieden ten opzichte van alleen mannelijke chromosomen. De rasseninformatie blijft een heikel punt, maar ook die informatie dient benut te worden. Het is al lang bekend dat in een ras veel meer variatie zit dan tussen rassen. Onze rassenindeling is dus een nutteloze en vooral gebaseerd op enkele triviale uiterlijke kenmerken.
Denk eens aan het drinken van melk. Grofweg kun je zeggen dat westerse mensen wel melk kunnen drinken en Afrikaanse mensen niet. De werkelijkheid is echter subtieler. Bij alle zoogdieren verdwijnt de lactase (enzym om melk om te zetten) activiteit na de zuigelingentijd, ook bij de mens. Er zijn echter mutanten, waarbij de lactase activiteit niet wordt uitgezet. Deze mutanten kunnen melk blijven drinken. Melk was een makkelijke bron van drinken, met vitamines, mineralen en calorieën. De mensen die het eerst besloten om vee te houden voor melkproductie hebben later de mutatie verworven om melk te blijven drinken. De lactase activiteit komt dus het meest voor bij de echte herdersvolken, ongeacht het werelddeel of ras: Ieren, Spanjaarden, Toeareg en Tutsi volken.
De teleurstelling
Wat een teleurstelling op 17 februari 2001. De technologie loopt iets te ver voor op het begrip. We weten niet eens hoeveel genen er precies zijn. Men denkt dat het er slechts 22.000 zijn, vele malen minder dan een willekeurige boom uit de tuin. De genen lijken echter wel complexer te zijn met veel intronen en rare repeat sequenties ertussen. De junk DNA blijkt niet eens zo zeer troep te zijn, als wel zichzelf repeterend DNA en oude virale genen: een bewijs van de plagen die onze voorouders hebben meegemaakt.
Een teleurstelling ook voor de farmaceutisch onderzoekers: er waren 300 GPCRs (speciale receptoren voor geneesmiddelen) bekend en geschat werd dat er nog 1800 gevonden zouden worden. Allen prima drug targets. Uiteindelijk zijn er waarschijnlijk maar 600 extra gevonden. Bijna alle nucleaire receptoren (zoals die voor de anticonceptie-pil) waren ook al bekend. Overigens zegt dit ook iets over de kwaliteit van het werk tot nu toe. Alle receptoren waren al met minder grove methoden gevonden. Petje af dus voor de klassieke moleculaire biologen en biochemici.
Een vergelijkbare teleurstelling had John Kendrew in 1958. Vijf jaar eerder bleek DNA een prachtig symmetrisch, geordende structuur te hebben. Kendrew helderde de eerste 3D-structuur op van een eiwit, myoglobine, en verzuchtte teleurgesteld:
“Perhaps the most remarkable features of the molecule are its complexity and its lack of symmetry. The arrangement seems to be almost totally lacking in the kind of regularities which one instinctively anticipates and it is more complicated than has been predicted by any theory of protein structure.”
Nog een teleurstelling. We weten niet opeens alles over ziekte. Misschien waren alle donoren kerngezond. Er moet nog veel gemeten worden.
Wat we wel weten
Verbazend genoeg weten we wel welk gen hoort bij bungyjumpen, wildwaterkanovaren en thrillseeken. De lengte van het gen voor een dopamine receptor D4DR bepaalt hoe de receptor efficacy voor dopamine is en dit is sterk gecorreleerd met thrillseeking. De causaliteit (het directe verband) is daarmee natuurlijk nog niet vastgesteld. Het kan altijd toeval zijn. Zo zei Richard Lewontin dat op het X-chromosoom een gen voor breien ligt, omdat alle mensen die hij zag breien een Y-chromosoom misten.
Wat weten we nog meer. Uit het DNA kunnen we ook herleiden dat de missing link, de moeder van chimpansee en mens, 5 miljoen jaar geleden leefde. Dat is erg lang geleden, maar niet als je bedenkt dat het slechts 300.000 generaties zijn, die er voor gezorgd hebben dat wij nog maar voor 98% op de chimpansee lijken. Overigens lijkt de mens, maar ook de chimpansee voor 97% op de gorilla. Stel dat je in Maastricht staat en de hand van je moeder vasthoudt. Zij houdt weer de hand van haar moeder vast enzovoort. De eerste generatie, de missing link staat dan in Leeuwarden. (deze vergelijking komt uit Matt Ridleys onvolprezen boek ‘Genome’ [1]) Dat is niet echt ver. De huidige mens stamt van 30.000 jaar geleden, dus de eerste 2 kilometer van de voorouderlijn kan gewoon met elkaar praten. In Maastricht wisten ze al lang dat ze 2 kilometer er buiten een ander taaltje spraken. De klok van bacteriën en virussen tikt veel sneller.
Bacteriën hebben 300.000 generaties in 25 jaar. Sommige virussen, zoals HIV, hebben zowel een reverse transcriptie als een gewone transcriptie nodig en daarbij worden veel fouten gemaakt. We kennen de 99 onderdelen (aminozuren) van HIV protease sinds 1985 en sindsdien zijn van bijna alle onderdelen mutaties gevonden. Gelukkig heeft de mens wel een goede machinerie voor DNA controle en reparatie.
Overal heerst de genenjacht, net als de Alaska-goudkoorts eind negentiende eeuw. Identieke tweelingen zijn het beste onderzoeksobject bij een genenjacht. Zelfs complex gedrag als het IQ is bij deze tweelingen vaak gelijk. Als 1 van de tweelingen ziek is en de ander niet, dan zou het zeer makkelijk moeten zijn om de genen te achterhalen die deze ziekten veroorzaken. Naar analogie hiermee speuren de genenjagers in gebieden waar weinig genetische variatie is (inteelt dus). Zo werd op het eiland Tristan da Cunha naar een astma-gen gezocht, omdat een op de vijf eilandbewoners aan astma leidt, hetgeen is terug te voeren tot slechts 3 vrouwen die in 1827 op het eiland aankwamen. Op Norfolk Island wordt hoge bloeddruk onderzocht, bij Patras de ziekte van Parkinson. Het gen voor de ziekte van Huntington is uiteindelijk gevonden bij families aan het meer van Maracaibo, Venezuela. In IJsland wordt een koppeling gemaakt tussen genetisch materiaal van alle bewoners, alle medische dossiers en een volledige stamboon vanaf 1000 na Christus. Alle IJslanders denken namelijk af te stammen van Erik de Noorman Een commercieel bedrijf hoopt hier een grote slag te slaan, tot grote zorg van vele IJslanders. Een puntmutatie in het prion-gen bij Libische joden is verantwoordelijk voor een erge prionziekte: fatale familiale insomnia.
De grote vraag is natuurlijk of dit niet weer tot teleurstelling leidt. Dadelijk hebben we een goed geneesmiddel voor 50 mensen op Norfolk Island, dat verder nergens in de wereld werkt. Nu zijn we op het terrein van de farmacogenetica.
Lees verder …
- M. Ridley, Genome, Harper Collins 2000, ISBN: 0060194979
- J. D. Watson, F. H. C. Crick, A structure for Deoxyribose Nucleic Acid, Nature, 171, 737 (1953).
Eerste figuur komt van de chemsoc.org/timeline.
©2007-EEM, gebaseerd op de column BITS uit Folia Pharmaceutica |