Language switching

Showing posts with label genetická genealogie. Show all posts
Showing posts with label genetická genealogie. Show all posts

Thursday, April 5, 2018

Jak vložit svá autozomální data z FTDNA do dalších databází (MyHeritage, Gedmatch, ...)

Tak dnes bych rád napsal malý návůdek pro začátečníky, jak využít vaše autozomální data z FamilyTreeDNA (tj. produkt Family Finder) v dalších genealogických databázích.

První krok je data stáhnout.
V okně, které vás čeká hned po přihlášení najdete v sekci Family Finder klíčovou frázi "Download Raw Data".

Protože chceme provést nahrání dat jak na MyHeritage tak na gedmatch.com, stáhneme jak verzi 36 Concatenated, tak verzi 37 Concatenated. Čísla 36, 37 udávají verzi lidského genomu, proti které byla data namapována (zpřesňování toho, jak náš genom vypadá, stále probíhá). Concatenated pak říka, že chceme všechny kusy DNA, které FTDNA poskytuje spojené do jediného souboru.


Teď když soubory máme, bude potřeba je nahrát.

1. MyHeritage


  MyHeritage v poslední době velmi zapracovala jak na svých algoritmech pro porovnávání osob, tak na nástrojích, které máme pro práci s DNA shodami k dispozici. Jedná se v dnešní době o zcela jistě nejmocnější uživatelsky příjemnou možnost pro genetické genealogy. Podle mě neexistuje důvod, proč na MyHeritage nebýt. Pokud budou nadalé pokračovat v nasazeném tempu, jejich užitečnost i velikost databáze jenom porostou.

  A teď uz k samostatnému nahrávání.
  Začneme v menu DNA, a zvolíme "Nahrát data DNA"

  Teď nás správně láká velké tlačítko Start.

K dalšímu kroku si řekneme pár detailů.
Za prvé si musíme vybrat, jestli jde o DNA naši, nebo někoho jiného.
Jedná-li se o někoho jiného, musíme ještě vybrat, o kterou osobu se jedná (a odpřísáhnout, že s nahráním souhlasí - tohle neberte prosím na lehkou váhu!, každý má právo volby, i vaše rodina:). Výběr osoby pak pracuje s rodokmenem, který na MyHeritage můžeme mít, takže pokud jsme nějaký nahráli, je výběr osoby velmi jednoduchý.
Poslední věcí co máme na výběr je zda zaškrtnout poslední položku - Souhlas o dohodě, ta totiž není povinná. Davá MyHeritage možnost použít naši DNA (anonymizovanou) pro vědecké účely. Takže se každý musí rozhodnout, zda je nakloněn této myšlence, či nikoliv. Já osobně vědu mile rád podpořím, takže jsem položku s radostí zatrhnul.

Po stisknutí tlačítka Nahrát tedy nezbývá než najít soubor stažený z FTDNA začínající znaky 37_Nase_Jmeno... Pak se soubor nahraje.

Zobrazí se informace s tím, že data byla úspěšně nahrána a nezbývá než čekat na email o tom, že jsou naše shody k dispozici.

2. Gedmatch.com gedmatch.com

Když jsem psal, že MyHeritage má nejlepší sadu uživatelsky příjemných nástroju, tak Gedmatch má tu sadu vůbec ale zdaleka nejlepší, včetně takových věcí jako vytváření DNA našich zesnulých předků, rozdělení naší DNA na otcovskou a mateřskou polovinu, zobrazení všech triangulačních skupin, mnoho ruzných odhadů etnicity, a podobně. S tou uživatelskou příjemností je to bohužel o malinko horší, ale nic čeho by bylo třeba se bát.

Takže kde začít?
Tenhle "Generic Upload FAST" je naše správná rychlá volba.

A
A co vyplnit?

Jméno testovaného

Přezdívku (pokud nechcete zobrazovat shodám plné jméno)
Pohlaví (Male = muž, Female = žena)

mitochondriální haplogrupa (lze vynechat)
Y haplogrupa (lze vynechat)


Máte povolení dané osoby data nahrát?
(opět na vás apeluji, neberte na lehkou váhu!)

A zde tedy vybrat soubor začínající 36_Vase_Jmeno...

A pak ted dostanete číslo, jako například T925337 a nezbývá než čekat, až budou vaše shody k dispozici.

Doufám, že jak na MyHeritage tak na GedMatch najdete mnoho zajímavých bratranců a sestřenic.


Saturday, December 30, 2017

Vše nej v roce 2018!

Doufám, že jste všichni měli moc povedené Vánoce a užili si spoustu času s rodinou. Mně se povedlo vidět přes Vánoce všechny své žijící předky (i všechny ostatní žijící předky mých dětí) a taky se potkat se všemi svými sourozenci a všemi jejich dětmi. Velmi úspěšné Vánoce :)


V tomhle blogu bych chtěl zrekapitulovat cíle, které jsem si tady vytyčil na rok 2017, a jak moc se povedlo je splnit.

Rychlá rekapitulace cílů:
  1. Mít zdravého syna.
  2. Zdokonalit rodokmen.
    2
    .1. Identifikovat 40% předků do 10té generace, tj. 818 předků (z  2046ti).
    2.2. Nalézt polovinu předků mého dědy z otcovy strany v 7mé generaci - tj. 64.
  3. Napsat sérii blogů v češtině pro začátečníky s genetickou genealogií.
  4. Najít alespoň jednoho z mých dvou nejbližších neznámých předků.
    4.1. Tento cíl zahrnuje sběr maximálního možného počtu relevantních DNA vzorků.
    4.2. Pracovat na rekombinační mapě otcovských chromozomů.
  5. Otestovat naše děti.
  6. Začít sloupek "Předek týdne" - kde bloguju o jednom ze svých zesnulých předků.
  7. Pokračovat v práci s genetickýma shodama.


Rád bych začal těmi nejůspěšnějšími:

1. Mít zdravého syna.
Ano! Vítek je prostě super (už umí říkat "táta"), a navíc se mi díky energii z jeho narození podařilo prohloubit znalosti otcovské linie Krcháků.

2.2. Nalézt polovinu předků mého dědy z otcovy strany v 7mé generaci - tj. 64.
Díky velmi intenzivní práci s předtolerančními matrikami jsem dokázal tenhlé cíl splnit. Třikrát hurá!

7. Pokračovat v práci s genetickýma shodama.
Práce s genetickýma shodama mě bavila a myslím, že se i dařila. Podařilo se mi nalézt společného předka pro několik amerických příbuzných (tak, že jsem prostě postavil jejich český rodokmen).
I napsat článek o shodách na 23andMe se podařilo.


U většiny dalších témat se podařilo dosáhnout častečného úspěchu:

2.1. Identifikovat 40% předků do 10té generace, tj. 818 předků (z  2046ti).
Dnes jsem na čísle 635 předků. Někteří trochu nejistí. To znamená roční nárůst známých předku o 24%. To mi přijde senzační, a původní cíl prostě příliš agresivní a nerealistický.
Pokud bych chtěl znovu mířit na 24%, můj nový cíl pro 2018 bude 788 předků.

3. Napsat sérii blogů v češtině pro začátečníky s genetickou genealogií

4. Najít alespoň jednoho z mých dvou nejbližších neznámých předků
Na základě DNA testování mám teď kandidáta na otce mého prapradědečka Antonína Šuly, narozeného 1871. Je jím František Skrejšovský, 1837.
Další testování bude potřeba pro ověření této hypotézy.

Další neznámý předek bude těžší, díky kombinaci endogamie na Horňácku a malého množství Čechů s autozomálními testy.

5. Otestovat naše děti.
Další úspěch na poslední chvíli. Posílal sem testy svých dcer do 23andMe z více než hodinové fronty na poště v Seattlu až 23tího prosince. Byl jsem příjemně překvapen, že i ta mladší, tříletá, dokázal naplivat plnou zkumavku (snad, ověřené z laboratoře to zatím není).
Můj nejmladší je zatím bez testů, vyhlížím nový GSA chip od FTDNA...

Úplné selhání:

6. Začít sloupek "Předek týdne".

Bohužel, předek týdne je to jediné, co jsem v roce 2017 vůbec nestihl. Snad nám to všem vynahradím v 2018!



Tak jsme si to pěkně shrnuli a já už se těším, až se s vámi podělím o plány na rok 2018. A doufám, že vám se povedlo ty vaše plány splnit ještě lépe, než mě.

Wednesday, November 29, 2017

Genetická genealogie pro začátečníky - Genetika a Příjmení - část 1

     Genetika a příjmení - část 1 - základy + hluboká minulost

Co jiného bych si mohl vybrat pro svůj první blog pro genetické genealogy začátečníky, než úspěšný český projekt "Genetika a Příjmení".

Že jste o něm ještě neslyšeli? Tak hybaj na stránky projektu. Tam se dovíte, že se jedná o projekt pro české (a hlavně prý moravské :) muže. Díky podpoře z grantů projekt umožňuje nechat si (na základě dostatečně zpracovaného rodokmenu) udělat zdarma základní STR test vašeho chromozomu Y. Tzn. nahlédnout trošku na kořeny vaší otcovské linie (otec otce otce otce otce ...).

Biologické a chemické stránce se budeme podrobněji věnovat v některém z dalších dílů, ale troška základů pro začátečníky. Chromozom Y je tzv. pohlavní chromozom, a má ho každý muž právě jednou (druhý pohlavní chromozom je X, který mají muži jednou, a ženy dvakrát).
Chromozom Y je specialní tím, že se jen s minimalními změnami (mutacemi) v každé generaci dědí z otce na syna.
A v době, kdy číst DNA nebylo vůbec jednoduché přišli vědci na zajímavý způsob jak změřit jak jsou si dva chromozomy Y vzdálené / blízké. Zjistili, že chromozom Y je protkán úseky, ve kterých se krátké kousky DNA (např. TCTA, ATT ap.) několikrát opakují - v angličtině "short tandem repeats", STRs. Takže když se podiváme na tyhle opakující se úseky, můžeme chromozom Y popsat. Např. se podíváme na dvanáct různých míst Y, 12 opakujících se kusů DNA - tzv. STR12.
Tím získáme sekvenci jako [14, 24, 15, 11, 14, 15, 11, 13, 13, 13, 11, 31].

Muže pak můžeme pomocí těchto počtů opakování STR porovnávat. Čím podobnější čísla, tím větší příbuznost.

A kolik těchhle STR čísílek člověk dostane z GAPu? 23. A kolik to teda vlastně je, dvacet tři? Inu, docela málo, člověku budou lehce vycházet jako genetické shody lidé, se kterými má společné předky třeba 2000 let v minulosti. Na tom není samo o sobě nic špatného, jen je třeba si to uvědomit, a s výsledky podle toho pracovat.

Tím jsme se oklikou dostali k tomu, co může člověk od výsledků čekat.

Jsou vlastně dvě hlavní kategorie.

1. Dávná minulost vaší otcovské linie. Díky tomu, jak se chromozom Y předává beze změn z otce na syna, je skvělou sondou do dávné minulosti vaší otcovské větve.
Umožňuje vám zjistit, kde vaši otcovští předci byli před 20ti, 10ti a pravděpodobně 2ma tisíci lety. (Ty 2 tisíce už vyžadují trochu štěstí a trochu práce).

Již docela dávno si lidé všimli, že ty STR čísla roztřiďují lidskou populaci do podobných tříd, tzv. "haploskupiny", nebo také haplogrup. Haplogrupy dostaly písmenka abecedy, kde úplně ta první, nejstarší, větev tzv. Y-chromozomálního Adama (praotce nás všech homo sapiens sapiens po otcovské linii) se jmenuje A. Velmi častá je skupina R, u nás pak druhá je skupina I.

Tyhle haploskupiny vlastně již tvoří strom (takový superhrubý rodokmen) našich otcovských linií:

(courtesy wikitree.com)

Tohle písmenko, pravděpodobně i s malým ocáskem dalších čísel a písmenek dostanete právě z GAP.
Tak hlavně, co ten ocásek? Je to vlastně docela jednoduché.
Písmenko vaší haplogrupy je první dělení. Představte si zjednodušeně, že to je váš prapra...prapraděda po otcovské linii.
Za písmenkem vždy následuje číslo, a za číslem zase písmenko.
Co tedy to první číslíčko znamená? Je to označení pořadí vaší podvětve, tedy zjednodušeně první syn (s unikátní mutací) ma číslo 1, třeba R1, druhý číslo 2, tj. R2, atd.
A v dalším kroku se zase jedná o větvení stromu (pořadí potomka), jen použijeme písmena, tj. R1a, R1b, atd.
Problém téhle notace je v tom, že se musela pořád předělávat, jak s dálším testováním přibývaly další větve. Takže se mohlo stát, že po chvíli se vaše I2b změnilo na I2a2 a pak na I2a2a atp.
Proto se dnes téměř bez výjimky přistupuje na notaci Jméno_haploskupiny-Jméno_SNP, např. I-M423.
A co je to teda to SNP? Česky čteme "snyp". SNP je "single nucleotide polymorphism" - místo v DNA, které může nabývat víc hodnot. Např. na pozici 16984211 máte třeba písmenko G nebo A. Pokud máte A, a jste právě v haplogrupě I, jste M423-pozitivní.
Pomocí těchto SNiPů se pak dá vybudovat ještě lepší strom, než pomocí STR.
Na jeden takový se můžete podívat na https://www.yfull.com/tree/.

Tak teď už snad trošku víte, co znamenají ta písmenka a čísla a můžeme se podívat na tu minulost.
Na české wikipedii je úplně strašně malinký popisek, ale je česky.

Zdaleka nejlepší místo, kam se podívat, pokud jen trošku ovládate angličtinu, nebo jste ochotni podstouput strojový překlad Googlu, je eupedia.com.
Tam naleznete velmi pěkné množství aktuálního materiálu, které by vám mělo dát do začátku rozumnou představu, kdo byli ti vaši otcovští předci zač.

Příště bychom se v části 2 podívali na tu druhou kategorii výsledků, naše Y-DNA shody. A v důsledku se pomocí nich zase vrátili k dnešní kategorii, dávné minulosti.

Pokud si chcete o GaP popovídat, neváhejte využít komentářů k blogu, nebo českých genealogických fór taby.cz a nebo klub na okoun.cz


Jo, a mimochodem, pokud se chcete GaP zúčastnit, tady je vstupní formulář: http://www.genebaze.cz/cgi-bin/gap/gap_ud.cgi

Monday, November 6, 2017

Vít, nový Krchák na světě!

Srdečné pozdravy všem čtenářům. Přijměte prosím mou omluvu za dlouho odmlku. Zmiňoval jsem se už, že vést dvojjazyčný blog je dvakrát víc práce než jednojazyčný blog?
A propos, už jsem zmiňoval, že tři děcka jsou vlastně jako dvě děcka, až na to, že na koníčky máte teda rozhodně míň času než dřív?

Nu což, vzhůru do práce. Nejste tady, aby jste poslouchali, jak si stěžuju.

Takže Vít. Vítek Krchák. Třetí v této (~2010) generaci Českých Krcháků. Po pravdě nic moc. Zdá se, že Krcháci v Čechách do pár generací vymřou.

A kdo tedy jsme? My chlapi, Krcháci? Z Horňácka, jihovýchodní Moravy, kraje chudého, ale na tradice bohatého? Mé první nakouknutí na naši otcovskou linii se odehrálo pomocí autozomálního testu u 23andMe, verze 4. Ten obsahoval několik tisíc SNiPů na Y chromozomu.


Podle jejich starého způsobu značení jsem byl I2b*. Nicméně trošká výzkumu proti Y stromu na ISOGG ukázala, že jsem ve skutečnosti větev I-M423, tedy I2a1b starou notací. Větev původních Evropských lovců a sběračů - Evropan jak poleno :D
23andMe nabízí o Y haplogrupách vlastní povídání, ale zdaleka nejlepší info jsem se dočetl na eupedii. Hlavně tam jsem se dověděl o základní historii I-M423.

Po trošce průzkumu jsem jasně viděl, že SNiPy jsou na výzkum chromozomu Y mnohem mocnější zbraň, než STRka. Díky jednoznačnosti a bohatější struktuře. Jako další krok jsem si tedy vybral I-M423 panel na yseq.net. To je Y test s daleka nejlepším poměrem cena výkon na trhu (pokud znáte svoji haplogrupu), a tým z yseq.net dělá vše proto, abych jejich panely zahrnovi vždy ty nejnovější známé mutace. Velká chvála Thomasovi Krahnovi.
Výsledky panelu mi poskytly mou "konečnou" (z hlediska dosud dosažených znalostí o Y stromě) SNP mutaci I-Y16473 and 4 nejbližší shody - Narog, Telencio, Rohaly and Girya. Polsko, Polsko, Maďarsko a Ukrajina. Nejbližsí společný předek 200 n.l. Expanze Slovanů na západ!
Úžasné.
Být schopen si spojit mutaci I-S17250 a její nejbližší podtřídy tak zřejmě se Slovanským stěhováním národů v první polovině prvního tisíciletí našeho letopočtu byl jeden z nejlepších výsledků, co jsem zatím z genetického testování dokázal vymáčknout.



Dalším krůčkem ve výzkumu mé Krchákovské linie bylo dohánět co jsem zanedbal - malý STR test. Ten jsem uskutečnil pomocí unikátního českého projektu "Genetika a příjmení", které se snaží mapovat česká příjmení na haplogrupy - genebaze.cz/gap.html. Pokud jste to ještě nezkusili, rozhodně se ozvěte! Je to úžasný způsob jak zadarmo s genetickým testováním začít.
Tak co jsem se dověděl? Jak by mohl malinký STR panel dodat nějakou informaci k SNP testu, obsahujícím všechny nejnovější větve? Jednoduše. Všude je TOLIK genealogů, kteří si nechali udělat jen STR test. Takže ač je SNP testování rozhodně mocnější co se týče časové umístění vašich shod a vytvoření stromu otcovských linií, neměli by jste STRka rozhodně zcela vynechat - umožní vám získat další (trochu neurčité) shody.
V mém případě to znamenalo nějaké blízké Slovenské shody, které žadné SNP testování nepodnikly. To krásně podpořilo rodinou legendu, že Krcháci přišli na Horňácko ze Slovenska.
(To je navíc dále podpořeno Slovenskými autozomálními shodami na čtvrtine DNA od mého dědečka Krcháka.)
Macák. Orava. Doufám, že jednou je na SNP test nalákam.
Moje IDčko na ysearch.org je AH7EK. Rovněž rovázané s mým WikiTree účtem.

Jak vždy říkám, jsou dvě cesty kterýma se může člověk ve světě Y-DNA vydat. Aktivní nebo pasivní.
Pasivní znamená čekat, až vaše shody absolvují všemožné testy, až vám vydláždí cestu. Je to ta levnější cesta. Ale možná vás nikam nedostane.
Aktivní znamená konat! Udělat si sekvenování chromozomu Y. Najít vaše nové mutace. Spolupracovat s testovacíma společnostma, aby jste vaše soukromé SNiPy dostale jak do panelů, tak do dlouhých seznamů testů na samostatné SNiPy. Pracovat s vašimi shodami, zda nemají některé vaše mutace společné. Snažit se navnadit vzdálené bratrance, aby se do toho sekvenování taky pustili. Tohle je mnohem dražší varianta, ale povede k výsledkům mnohem pravděpodobněji, v mnohem kratším čase.

Ja si samozřejmě vybral tu aktivní cestu. Takže můj další krok byl logicky BigY test of FTDNA. Nebo ne?

Aby jste si od FTDNA mohli koupit BigY test, musíte u nich první otestovat nějaké STRka. Ono je to nakonec asi v pořádku, protože nikdo nechce utratit 400 dolarů, aby zjistil, že jeho bratranec měl ve skutečnosti adoptovaného pradědečka.
Pomocí projektu je možné si objednat 12STR, aby člověk minimalizoval náklady. Ale když už se má člověk do té FTDNA STR databáze dostat, tak ať ty shody stojí zato. Začal jsem raději rovnou s 37STR indikátory. Tedy asi 15 navíc proti těm co už jsem měl z GaP.

Stálo to za to? Ani ne. Šel bych do těch 37mi radši než do 12ti znova? To zas jo.
Problém je, jak přísný limit na shody FTDNA na úrovni 37STR indikátorů má. Snaží se motivovat lidi ke koupi 67mičkových a 111kových panelů. Je to hnusná vydírací taktika, ale holt to tak je. FTDNA si na živobytí vydělává hlavně pomocí STR testů, a vždycky se snažila tu být předně pro genetické genealogy (ne jako některé jiné společnosti, kterým jde opravdu jen o zisk).
Takže 37STR test žádné nové poznatky nepřinesl, ale vždycky může zkoušet všechny své blízké STr shody přesvědčovat na BigY test.

Se splněnou podmínkou v podobě STR testu byl BigY konečně na dohled. Akorát byl dál, než to vypadalo. Několik odložených slíbených časů dodávky, a déle než 3 měsíce čekání... Ale když jsem se konečně dočkal tak to rozhodně stálo za to.

Nová finální větev s mou shodou - Larrym Telenciem. I-FGC40352. Paráda. Skvělé. Úžasné. Takhle se tvoří Y strom.
Navíc jsem dostal 8 soukromých mutací, které teď čekají na další shody.
Potenciál pro další výzkum, blíže současnosti. Sem s ním!

A tím se jako s testováním skončil? Ne tak úplně. Sekvenování je známé nelehkostí interpretace. A FTDNA to dělá obzvlášť blbě. Proto taky většina lidí, která Yové sekvenování podstoupí, jde o krok dál. Objedná si detailní analýzu souboru BAM za 49$ na https://www.yfull.com.
Tam se výsledky dostávají postupně:

  1. SNP výsledky - tohle je podstata analýzy, najív nové finální listy v Y stromě a identifikovat vaše soukromé mutace (a míru jejich spolehlivosti).
  2. STR výsledky - několik stovek STRek, které se dají pomocí NGS přečíst. A taky STR shody.
  3. nový Y strom - vám konečně ukáže vaši novou, vysněnou větev Yového stromu s vaší soukromou mutací - a odhadem jejího stáří.
Tak jsem s tím výzkumém Y chromozomu, co můj syn ponese dál do budoucnosti, docela pokročil, ale stále je kam jít.

Přesvědčit blízké shody, aby rovněž absolvovali sekvenování chromozomu Y, a nebo alespoň otestovali přítomnost mých soukromých mutací v jejich DNA. Snad se mi to u některých (z Vás) podaří.
Koupit BigY pro známé vzdálené bratrance po otcovské linii, abychom lépe definovali, které z mých soukromých SNiPů jsou ty starší. A rovněž za účelem umístění Krchákovské větve na rozličné Y stromy (YFull, ISOGG, FTDNA).

Další rok, další krok kupředu. Už se těším co se na poli Y výzkumu dovím v roce 2018.

Jo a taky si můžu odškrtnout můj první cíl ze seznamu na rok 2017. Uff.

Tuesday, October 31, 2017

Nová verze 23andMe i pro Čechy!


Rád bych se vrátil ke svému blogu, a k tomu citím, že je zapotřebí přeložit posledni článek z února, abych dostál česko-anglické paritě a mohl jít dál.

Co tedy budeme dohánět?

23andMe konečně ohlásila, že bude převádět zahraniční účty bez zdravotních výsledků - takže Británie, Kanada a Dánsko maji zatím smůlu. (dnes, v říjnu, už je tedy převedeno vše).

Co nám tahle změna přinese? Trochu horší práci s našimi shodami :( To je na té přicházející změně asi nejhorší - nový vzhled a ovládání je směřováno na začátečníky a nenabízí takovou rychlost a důraz na výsledky, jako staré stranky. Navíc veledůležitý chrome plugin 529andYou nepracuje zcela automaticky, což bude při práci s velkým množstvím dat rozhodně chybět. 23andMe mám ze všech stránek nejradši právě kvůli výborným schopnostem pluginu 529andYou, který umožňuje ověřovat triangulační skupiny téměř bez námahy.

Na druhou stranu, máme na co se těšit:

  1. Souhlas s pozvánkama, hurá! Mám už asi 4 měsíce zabugovaný účet, neschopný odsouhlasit pozvánku od někoho jiného.
  2. Čtení a psaní zpráv! Dvakrát hurá!! Můj účet, asi kvůli velkému množství shod, už neumožňoval čtení nových zpráv. Má omluva všem co mi psaly a nikdy se nedočkali odpovědi. 
  3. Schopnost ozvat se anonymním shodám! Konečně se budeme zase schopní ozvat anonymním shodám. Často ani neví, že jsou "anonymní" a nemají žádný problém sdílet.
  4. Nová funkcionality In-Common-With - "společné shody". Tohle bude strašně důležitá nová vlastnost, která nám umožní rychle nahlédnout, kdo je s kým příbuzný.
  5. A spousta dalších drobnosti, jako například novější informace o můžských haplogrupách.

Rád bych využil téhle příležitosti, a vyslal ještě jednu vlnu pozvánek. Kdo ví jak budou věci vypadat. Jedna věc je jistá - schválené shody zůstavají schválenýma shodama i skrz přesun na nové stránky.
Takže zřejmě schválené shody = dobrá věc :)

Pokud jste náhodou má shoda, moc rád vám pomůžu s lepším porozuměním genetické genealogii - nebo s lepším porozuměním vašim středoevropským, především českým předkům.
I když vás nic z toho nezajímů, moc pomůžete výzkumu našich společných kořenu, pokud odsouhlasíte mou nabídku ke sdílení. Umožní mi to lépe stanovit triangulační skupiny, kusy DNA mě a mých shod z konkrétního společného předka. Sdílení mi umožní vidět jen ten malý kousek DNA, který sdílíme a nenese žádné bezpečnostní riziko.

Také bych rád udělal novou verzi naší série o sdílení. Jak se situace změnila od ledna?

Tady je porovnání s posledním loňským blogem:
DNA shodyAnonymníOdsouhlasené% odsouh.
já (Kuba)952 (+6)214 (-25)381 (+21)40.02%
matka854 (+9)239 (-32)311 (+25)36.42%
otec918 (+2)196 (-33)391 (+30)42.59%
bab. z m. strany1122 (+19)293 (-9)516 (+21)45.99%
bab. z o. strany925 (+5)241 (-34)337 (+11)36.43%
děd. z m. strany957 (+14)229 (-28)357 (+23)37.30%
manželka898 (+8)224 (-50)304 (+29)33.85%

Zajímavé, že všechny ty změny jsou bez jediné pozvánky.

A přesto se nám daři u některých profilů překonat magickou 40% hranice! Paráda.
Přestože je poslední dobou na 23andMe slyšet dost negativních reakci (na facebooku, různých fórech), já můžu směle říct, že počet shoda roste na úplně všech profilech.
A zároveň klesá počet anonýmních shod, často téměř rychlostí světla - když z manželčiného seznamu shod jich ubylo celých 50.

Vychází mi jednoduché pozorováni. Dokud budete své shody pozývat ke sdílení, statistiky budou vypadat pěkně. Budete mít víc a víc bratranců a sestřenic ke zkoumání.

Jak jsou na tom neodsouhlasené pozvánky? Podívejme se:


Šest zabugovaných pozvánek. Snad zůstanou i po přechodu.
A víc než tři a půl tisíce neodsouhlasených shod. Včetně těch nejbližších. Moc doufám, že tahle vlna pozvánek dokáže některé z mých shod zastihnout. Dostat to dolů na 3000 by bylo úžasné ;)

Ja bych se na to nové 23andMe díval s pozitivními emocemi. Čekají nás nové skvělé nástroje. Stejně jako staronová schopnost pozvat ke sdílení anonymní shody.

A v neposlední řadě teď tvrdě (jak jen čas dovolí) makám na rodokmenu, takže napojovat shody bude zase jednodušší. Doufám :D

Sunday, January 1, 2017

Cíle na rok 2017

Nejpředněji: Vše nej v novém roce! 🎉🎉🎉 Ať je pro Vás velmi vydařený, se spoustou genealogických ůspěchů, mnoho nových DNA shod a hlavně jen a jen zdravé rodinné příslušníky.

Nový rok je vždy skvělá příležitost udělat si ve věcech pořádek a pustit se do toho s novou vervou.

Takže čeho bych rád dosáhnul? Některé cíle jsem již zmiňoval ve dvou posledních bilančních blozích. Zahrnuji je tedy do celkového seznamu, který seřadím podle důležitosti.

  1. Mít zdravého syna. Juchúúú! Nejde o čistě genealogicky ani čistě genetický cíl, ale péče o novorozeného syna bude určitě z toho nejzajímavějšího, co 2017 nabídne. Za daň padne nějaký ten volný čas - takže prosím omluvte případné delší odmlky. Rovněž bych rád touto formou obrovsky poděkoval své úžasné ženě. Díky lásko, miluju Tě 💖
  2. Zdokonalit rodokmen. Tomuto tématu a jeho podbodům jsem se věnovali v posledním loňském bilančním blogu.

    2.1. Identifikovat 40% mých vlastních předků do 10té generace včetně. To znamené identifikace 818ti předků (z celkových 2046ti). Dnes jich [pravděpodobně] znám 512. To tedy znamená identifikovat dalších 306 nových předků v roce 2017.

    2.2. Nalézt polovinu předků mého dědy z otcovy strany v 7mé generaci - tj. 64 mých prapraprapraprapra.
  3. Napsat sérii blogů v češtině pro začátečníky s genetickou genealogií.
  4. Najít alespoň jednoho z mých dvou nejbližších neznámých předků. Jeden pradědeček mé babičky z otcovy strany a jeden pradědeček dědy z otcovy strany jsou neznámí (babičky byly nemanželské). Atakovat jejich identitu pomocí DNA je od začátku jeden z hlavních plánů mé geneticko genealogické kariéry. Kdyby se podařilo alespoň jednoho najít, byl by to signifikantní výsledek.

    4.1. Tento cíl zahrnuje sběr maximálního možného počtu relevantních DNA vzorků na otcově straně rodiny.

    4.2. Pracovat na rekombinační mapě otcovských chromozomů a maximalizovat pokrytí předky.
  5. Otestovat naše děti. Se ženou jsme se shodli, že do toho půjdeme, za pár let to bude běžná součást poporodního vyšetření. Takže najít nejlepší možnost a uskutečnit ji bude jedna ze zajímavých částí 2017.
  6. Začít sloupek "Předek týdne" - kde podrobně bloguju o jednom ze svých zesnulých předků. Předpokládám, že jich za rok zvladnu jen pár, ale těším se na to.
  7. Pokračovat v práci s genetickýma shodama - kde součástí tohoto cíle jsou i detailnější plány z nedávného bilancování shod na 23andMe.
Určitě bych toho rád stihl víc, ale znáte to - kdo chce moc, nemá nic. Zůstanu tedy u 7. Budu se snažit každému z těchto cílo v tom novém roce věnovat, s prioritou shora dolů.

Stav rodokmenu na konci 2016

Ve svém vůbec prvním blogu jsem se moudře věnoval rodokmenům. Zcela neoddiskutovatelně se totiž jedná o nutnou podmínku práce každého "genetického genealoga" a je to pomůcka zdaleka nejdůležitější. Zdůrazňoval sem, že většina našich genetických shod budou naši "osmí bratranci/sestřenice", tedy potomci našich 7xpra dědečků/babiček. A proto potřebujeme kvalitní a hluboký strom.

Co jsem tedy dělal od prvního blogu v říjnu? Pravdou je, že jsem se spíš opět zabýval genetikou (e.g. série o shodách na 23andMe) a nepokročil tolik, kolik jsem doufal při psaní úvodního blogu.

Pojďme se na to podívat v tabulce:

gen#vztahshoda#předků v genmůj #idmbab#idmděd#idobab#idoděd#id
2děd1C444444
3pra2C888877
4prapra3C1616151614 (+3)14
53xpra4C32303032 (+1)22 (+4)26 (+1)
64xpra5C6459 (+3)49 (+1)38 (+4)2732 (+7)
75xpra6C128110 (+6)21 (+5)31 (+6)18 (+3)4 (+1)
86xpra7C256146 (+11)6 (+2)46 (+19)11 (+4)0
97xpra8C51274 (+15)4 (+3)43 (+15)10 (+4)0
108xpra9C102463 (+25)1 (+1)8 (+2)6 (+4)0

Alespoň nějaký pokrok naznačený čísly s plusy v závorkách jsem dokázal. 

Podívejme se nejprve na počet mých nalezenych předků v každé generaci do slabě fialového sloupce (můj #idd). Našim cílem je, aby tyto čísla byla stejná jako ta v tmavě fialovém sloupci (celkový počet předků v dané generaci). Až do sedmé generace se nám docela daří, ale pak čísla tragicky klesají. Je to hlavně způsobeno větší obtížností hledání předků před tolerančním patentem - tlustšími matrikami, neexistencí indexů, menším množstvím údajů v matrikách ale i větším množstvím předků celkově.
Jak už jsem říkali, naše shody budou nejčastěji s osmými brantranci (8C v modrém sloupci) a tam se nám podařilo identifikovat pohých 74 z 512 předků (ne nutně 512 různých osob, někteří naši předci jsou našimi vícenásobnými 7xpra). To jasně ukazuje jak obtížná a frustrujíci bude práce s našimi DNA shodami. Potřebuju na stromě proste ještě zamakat.

Doteď jsem zmiňoval výzkum předků pouze ze svého pohledu. Ve čtyřech bílích sloupčcích jsou pak údaje mých prarodičů (takže součet jejich 4 řádek koresponduje s mým, o dva řádky níže). Nejčastěji totiž pracuji se svými shodami z pohledu svých prarodičů (kde mám zmapovanou celou DNA). A zde je situace u 8mých bratranců naprosto tragická. Tady se prostě nedá očekávat, že budeme v hledání společných předků jakkoliv úspěšní.

Ač mě práce s DNA baví, je potřeba se zaměřit na rodokmen, práci s matrikami, a dalšími zdroji. A rozhodně se musím zaměřit na strom svého dědečka z otcovské strany (oděd v tabulce).

Pro 2017 bych si rád vytyčil dva cíle, co se mého rodokmenu a identifikace předků týče:
  1. Nalézt polovinu předků mého dědy z otcovy strany v 7mé generaci - tj. 64 mých prapraprapraprapra. Plán je to ambiciózní, neboť 64 v této generaci se neblížím ani u žádného z dalších prarodičů, ale je důležité, dávat si obtížné cíle. 
  2. Identifikovat 40% mých vlastních předků do 10té generace včetně. To znamené identifikace 818ti předků (z celkových 2046ti). Dnes jich [pravděpodobně] znám 512. To tedy znamená identifikovat dalších 306 nových předků v roce 2017.
Celkově bych se rád více věnoval rodokmenu, ale zůstal přitom aktivní i zde na blogu.

Saturday, December 10, 2016

20 otázek pro genetické genealogy

Blaine T. Bettinger - autor knih o genetické genealogii a autor blogu http://thegeneticgenealogist.com/ - vytvořil následujících 20 otázek o publikoval je na ISOGG Facebook Group (mezinárodní skupině pro genetické genealogy na Facebooku). Rád bych zjistil, jak jsou na tom v tomhle ohledu Češi.

1. Kdo byl první člověk, kterému jsi dělal DNA test?
Všechny žijící prarodiče najednou.
2. Co byl tvůj vlastní první test?
Autozomální DNA na 23andMe.
3. Který rok jsi odebral svůj první test?
2013

4. Který je poslední test, co jsi udělal?
SNP balíček na 
yseq.net
5. Udělal jsi úplný test mitochondriální DNA na FamilyTreeDNA?
Ne.

6. Jaká je tvá mitochondriální haplogroupa?
T2b

7. Máš nějaké úplné mitochondriální shody?
nevím.

8. Jaký je maximální počet STR markerů, které jsi/tvůj mužský příbuzný testoval?
37

9. Jaká je Y haplogroupa tvého otce?
I-Y4882 (pod I-S17250)

10. Máš nějaké úplné Y shody? 
Ne

11. Testoval jsi na všech 3 největších testovacích společnostech? 
Ano

12. Nechal sis udělat test celého genomu?
Ne, ještě čekám, až cena víc spadne ;)
13. Kolik testů spravuješ? 
Asi 15
14. Používáš GEDmatch? 
Ano
15. Jaký je tvůj oblibený nástroj na GEDmatchi? 
Porovnání 1 na 1ho.
16. Dokázal si testovat své rodiče? 
Ano, oba.
17. Dokázal si testovat své prarodiče? 
Ano, 3.
18. Věk nejstarší osoby kterou jsi otestoval? 
89
19. Skončil jsi s testováním příbuzných? 
V žádném případě!
20. Kdyby si mohl požádat KTERÉHOKOLIV předka o test, koho by si požádal?
Asi mé nejbližší předky, děti otců neznámých - Antonína Šulu and Annu Chrenčíkovou, prapradědu a praprabábu.


Těším se, až si přečtu vaše odpovědi, klidně to zkuste tady pod blog :) Zde je prázdný seznam:
1. Kdo byl první člověk, kterému jsi dělal DNA test?
2. Co byl tvůj vlastní první test?
3. Který rok jsi odebral svůj první test?
4. Který je poslední test, co jsi udělal?
5. Udělal jsi úplný test mitochondriální DNA na FamilyTreeDNA?
6. Jaká je tvá mitochondriální haplogroupa?
7. Máš nějaké úplné mitochondriální shody?
8. Jaký je maximální počet STR markerů, které jsi/tvůj mužský příbuzný testoval?
9. Jaká je Y haplogroupa tvého otce?
10. Máš nějaké úplné Y shody? 
11. Testoval jsi na všech 3 největších testovacích společnostech? 
12. Nechal sis udělat test celého genomu?
13. Kolik testů spravuješ? 
14. Používáš GEDmatch? 
15. Jaký je tvůj oblibený nástroj na GEDmatchi? 
16. Dokázal si testovat své rodiče? 
17. Dokázal si testovat své prarodiče? 
18. Věk nejstarší osoby kterou jsi otestoval? 
19. Skončil jsi s testováním příbuzných? 
20. Kdyby si mohl požádat KTERÉHOKOLIV předka o test, koho by si požádal?

Saturday, November 19, 2016

Jak přemluvit shody na 23andMe ke sdílení?

  Pod vlivem svého prvního blogu jsem teď trochu polevil v genetické genealogii a trochu víc (když čas dovolí) se věnuju rodokmenům.
  Za účelem tohoto blogu bych se rád vrátil na svou "domovskou" stránku - 23andMe, kde jsem otestoval nejvíc lidí a zpracoval nejvíc dat.

Mám tam téměř 2800 neodsouhlasených žádostí o sdílení DNA. Ano, DVA TISÍCE, teda spíš tři. Pěkná pruda... Jak pak má člověk dělat nějaké objevy?!

Co chci udělat - obeslat všechny shody, které mohu, žádostí o sdílení. A nakonec chci změřit úspěšnost tohoto pokusu.

Tak jak si na tom se shodama stojí mých 5 nejzajímavějších profilů?
DNA shodySdílející shody% sdíleno
já (Kuba)91830833.55119826
babička z máminy strany107646142.84386617
babička z tátovy strany89829132.40534521
děda z máminy strany91127930.62568606
manželka88222825.85034014

Jak vidíte, nejvíc jsem se věnoval shodám me babičky z mamčiny strany. Na shodách mé ženy jsem nepracoval o nic méně intenzivně, ale sebe a mou ženu jsem testoval až více než rok po prarodičích (a má vlastní čísla jsou důsledkem práce na prarodičích).

Co tak můžeme čekat? Budu rád, pokud se nám podaří získat 20 nových sdílení pro každého prarodiče (a s trochou štěstí 20 pro můj vlastní profil) and snad i 40 pro mou ženu.

Co uděláme? Napíšeme všem jednotný email. Napsat každému zvlášť by bylo skvělé, a zvýšilo naše šance, ale je možné to dělat opravdu jen s nejbližšími shodami. Psát osobní zprávu dvěma tisícum shod by bylo na rok.

Takže co hlavního budeme psát?

1. Kdo jsme - spousta Američanů má obavy, že se je někdo snaží podvést. Ustanovit přátelskou, rodinnou, důvěrnou atmosférou je základ.

2. O co nám jde (proto taky píšu tenhle blog, aby to bylo jasné).

3. Něco o naší rodině - veřejný odkaz na rodokmen, naše genetická data na gedmatch.com, ap.


Hello, 

my name is is Kuba Krchak and I am living in the Czech republic. I work as a computer scientist, with huge interest in genealogy, genetics, population genetics, next generation sequencing et.al. 

I maintain a blog bgengen.blogspot.com, where I just wrote about the struggle with matches on 23andMe. Please, check it out if you have a little bit of time. http://bgengen.blogspot.cz/2016/11/can-i-get-any-more-people-on-23andme-to.html

I am trying to work on the project of creating a recombination map for me and my family and eventually mapping the DNA to ancestors. 
You are one of my unshared matches and you accepting my sharing request would tremendously help me in my efforts.
I am eager to talk to you about your ancestry, but that is optional. Just accepting my sharing request is very valuable to me. 

Here is my basic public tree: www.wikitree.com/treewidget/Krchak-1/5 
My most up-to-date tree is http://krchak.myheritage.com
I also do have an ancestry tree: http://trees.ancestry.com/tree/82403601/family
My gedmatch ID is M240291. 

Best regards, 
Kuba 

Podle toho, o koho půjde jen pozměníme odkazy na strom a gedmatch. Aby lidé nemuseli sami hledat babičku ve stromě. Čím víc to můžeme ulehčit, tím lépe.

Tak pojďme do toho. Ozvu se asi za týden se shrnutím, jak se nám tahle kampaň povedla. Je nutné mít na paměti, že už jsme 30-40% shod měli. Pokud bychom začínali, tak je úspěšnost samozřejmě lepší.