Dr Karsten Eastman objašnjava zašto tvrdnje o bibliotekama od "triliona" članova često ne odgovaraju praktičnoj realnosti. Masa DNK, stop kodoni i broj kopija po varijanti postavljaju tvrdi plafon na koliko različitih molekula može biti prisutno u jednom poolu. Dodatno, dostupnost ciljnog proteina i način prezentacije često ograničavaju praktičnu veličinu biblioteke više nego hemija. Umesto trke za veličinom, autor predlaže pametniji dizajn i više arhitektura.
Kad biblioteke od triliona članova udare o fiziku: šta raznolikost zaista znači

Dr Karsten Eastman, izvršni direktor Sethera Therapeutics, upozorava na praktična ograničenja pri tvrdnjama o bibliotekama "triliona" članova i objašnjava zašto masa DNK i dostupnost ciljnog proteina postavljaju tvrde granice stvarne raznolikosti.
Zašto broj članova biblioteke zaista znači
U ranoj fazi otkrivanja lekova, velike biblioteke povećavaju šansu da se pronađu retki molekuli koji imaju odgovarajuću kombinaciju potentnosti, selektivnosti i svojstava pogodnih za razvoj. Platforme kao što su mRNA display, phage display i DNA‑encoded libraries često se opisuju brojem teoretskih sekvenci koje mogu da generišu. Međutim, postoji presudan praktičan korak između teorijske raznolikosti „na papiru“ i broja različitih molekula koji su fizički prisutni u jednoj selekcijskoj epruveti.
Fizika mase DNK — tvrdi plafon
Broj jedinstvenih molekula u jednom poolu ograničen je masom DNK koju imate. Primer iz prakse: pretpostavimo 4 µg duplostruke DNK (dsDNA) po epruveti, konstrukti dugi ~200 bp i masa jednog bp ≈ 660 g/mol. Molekulska masa 200 bp fragmenta je ~132.000 g/mol. Deljenjem 4 × 10-6 g sa 132.000 g/mol i množenjem Avogadrovom konstantom dobijamo ≈ 1,8 × 1013 molekula (≈ 1.8e13).
To je maksimalan broj različitih šablona koji mogu fizički biti prisutni—ni jedan tok rada ne može „stvoriti“ više unikatnih molekula nego što je DNK na početku sadržala.
Uticaj kodiranja i stop kodona
Često se koristi NNK randomizacija (N = A/C/G/T; K = G/T), što daje 32 kodona, od kojih 31 kodira aminokiselinu, a 1 je stop. Za 12 varijabilnih pozicija frakcija sekvenci bez stop kodona je (31/32)12 ≈ 68%. Od gore navedenih ~1.8 × 1013 molekula, to znači da bi približno 1.2 × 1013 bila pune dužine bez stop kodona.
Ipak, to je samo ~0,3% od teorijskog sekvencijalnog prostora 2012 ≈ 4,096 × 1015. Dakle, i „agresivni“ realan build i dalje uzorkuje veoma mali deo teorije.
Koliko DNK treba za jednu kopiju svake sekvence?
Da bi svaka od 2012 sekvenci imala po jednu kopiju pri 200 bp, bilo bi potrebno ~1 mg DNK. U praksi, radi pouzdanog uzorkovanja, potrebne su višestruke kopije: za ~95% pokrivenost treba ~3 kopije po sekvenci (~2,7 mg DNK), a za ~99% oko 4,6 kopija (~4,1 mg DNK). Ove vrednosti su često znatno iznad DNK količina koje se rutinski koriste u display i DEL protokolima, posebno kad se uračunaju gubici u amplifikaciji, ligacijama i transkripciji.
Širenje alfabeta drastično povećava zahteve
Ako se svaki položaj proširi sa 20 na 60 gradivnih blokova (npr. L‑α, D‑α i β‑kosturi sa istim bočnim grupama), 6012 ≈ 2,2 × 1021 mogućnosti. Imati po jednu kopiju svake od tih sekvenci zahtevalo bi stotine grama do reda veličine pola kilograma DNK; za ~95% pokrivenost prelazi se u kilogramsku skalu. Ovo jasno pokazuje da takve biblioteke nisu ostvarive kao jedinstveni poolovi.
Ograničenje cilja (targeta)
Čak i da imate ekstremno raznoliku biblioteku, svaki molekul mora imati šansu da sretne cilj—obično prečišćen protein na površini ili zrnima. Većina preseva koristi mikrograme do miligrame proteina. Skaliranje proizvodnje cilja za 6–8 redova veličine da bi se "poklopilo" sa tvrdnjama kao što su 1020 članova je ekonomski i tehnički neprihvatljivo. Dakle, broj dostupnih molekula cilja često ograničava realnu veličinu biblioteke više nego hemija koji stoji iza nje.
Pametnija strategija — više arhitektura, manje nula
Ponovljeno pravljenje istog 4 µg, 12‑pozicionog builda 100 puta kumulativno dovodi do ~1,8 × 1015 molekula — i to pod predpostavkom da su svi potpuno jedinstveni. Čak i tada to pokriva samo deo teorijskog prostora. Umesto da se troše resursi na beskonačno povećanje broja članova iste arhitekture, efikasnije je stvarati različite arhitekture: varirati dužine petlji, obrasce kovalentnih ograničenja, hemijske modifikacije i topologije. To povećava praktičnu, funkcionalnu raznovrsnost koja ima veću šansu da pronađe stvarno upotrebljive hitove.
Pravila za proveru tvrdnji o raznolikosti
- Koliko DNK je ubačeno u selekcioni pool? Iz mase i dužine konstrukta izračunava se maksimalan broj šablona.
- Koliko kopija po varijanti je prisutno? To pokazuje koliki deo teoretskog prostora je zaista uzorkovan.
- Koliko i kako je cilj prezentovan? Ekonomija i fizika cilja često postavljaju praktična ograničenja.
Zaključak: važno je razlikovati teorijsku raznolikost od praktične. Fizika mase DNK i realnosti targeta znače da su smislena arhitektura, više varijacija i iskrena računovodstva materijala daleko važniji od impresivnih, ali često nerealanih brojki na slajdovima.
Tekst: "When trillion‑member libraries meet physics: what diversity really means" — originalno objavljeno u Pharmaceutical Technology. Autor: Dr Karsten Eastman.
Pomozite nam da budemo bolji.


































