Language switching

Showing posts with label shody. Show all posts
Showing posts with label shody. Show all posts

Thursday, April 5, 2018

Jak vložit svá autozomální data z FTDNA do dalších databází (MyHeritage, Gedmatch, ...)

Tak dnes bych rád napsal malý návůdek pro začátečníky, jak využít vaše autozomální data z FamilyTreeDNA (tj. produkt Family Finder) v dalších genealogických databázích.

První krok je data stáhnout.
V okně, které vás čeká hned po přihlášení najdete v sekci Family Finder klíčovou frázi "Download Raw Data".

Protože chceme provést nahrání dat jak na MyHeritage tak na gedmatch.com, stáhneme jak verzi 36 Concatenated, tak verzi 37 Concatenated. Čísla 36, 37 udávají verzi lidského genomu, proti které byla data namapována (zpřesňování toho, jak náš genom vypadá, stále probíhá). Concatenated pak říka, že chceme všechny kusy DNA, které FTDNA poskytuje spojené do jediného souboru.


Teď když soubory máme, bude potřeba je nahrát.

1. MyHeritage


  MyHeritage v poslední době velmi zapracovala jak na svých algoritmech pro porovnávání osob, tak na nástrojích, které máme pro práci s DNA shodami k dispozici. Jedná se v dnešní době o zcela jistě nejmocnější uživatelsky příjemnou možnost pro genetické genealogy. Podle mě neexistuje důvod, proč na MyHeritage nebýt. Pokud budou nadalé pokračovat v nasazeném tempu, jejich užitečnost i velikost databáze jenom porostou.

  A teď uz k samostatnému nahrávání.
  Začneme v menu DNA, a zvolíme "Nahrát data DNA"

  Teď nás správně láká velké tlačítko Start.

K dalšímu kroku si řekneme pár detailů.
Za prvé si musíme vybrat, jestli jde o DNA naši, nebo někoho jiného.
Jedná-li se o někoho jiného, musíme ještě vybrat, o kterou osobu se jedná (a odpřísáhnout, že s nahráním souhlasí - tohle neberte prosím na lehkou váhu!, každý má právo volby, i vaše rodina:). Výběr osoby pak pracuje s rodokmenem, který na MyHeritage můžeme mít, takže pokud jsme nějaký nahráli, je výběr osoby velmi jednoduchý.
Poslední věcí co máme na výběr je zda zaškrtnout poslední položku - Souhlas o dohodě, ta totiž není povinná. Davá MyHeritage možnost použít naši DNA (anonymizovanou) pro vědecké účely. Takže se každý musí rozhodnout, zda je nakloněn této myšlence, či nikoliv. Já osobně vědu mile rád podpořím, takže jsem položku s radostí zatrhnul.

Po stisknutí tlačítka Nahrát tedy nezbývá než najít soubor stažený z FTDNA začínající znaky 37_Nase_Jmeno... Pak se soubor nahraje.

Zobrazí se informace s tím, že data byla úspěšně nahrána a nezbývá než čekat na email o tom, že jsou naše shody k dispozici.

2. Gedmatch.com gedmatch.com

Když jsem psal, že MyHeritage má nejlepší sadu uživatelsky příjemných nástroju, tak Gedmatch má tu sadu vůbec ale zdaleka nejlepší, včetně takových věcí jako vytváření DNA našich zesnulých předků, rozdělení naší DNA na otcovskou a mateřskou polovinu, zobrazení všech triangulačních skupin, mnoho ruzných odhadů etnicity, a podobně. S tou uživatelskou příjemností je to bohužel o malinko horší, ale nic čeho by bylo třeba se bát.

Takže kde začít?
Tenhle "Generic Upload FAST" je naše správná rychlá volba.

A
A co vyplnit?

Jméno testovaného

Přezdívku (pokud nechcete zobrazovat shodám plné jméno)
Pohlaví (Male = muž, Female = žena)

mitochondriální haplogrupa (lze vynechat)
Y haplogrupa (lze vynechat)


Máte povolení dané osoby data nahrát?
(opět na vás apeluji, neberte na lehkou váhu!)

A zde tedy vybrat soubor začínající 36_Vase_Jmeno...

A pak ted dostanete číslo, jako například T925337 a nezbývá než čekat, až budou vaše shody k dispozici.

Doufám, že jak na MyHeritage tak na GedMatch najdete mnoho zajímavých bratranců a sestřenic.


Tuesday, October 31, 2017

Nová verze 23andMe i pro Čechy!


Rád bych se vrátil ke svému blogu, a k tomu citím, že je zapotřebí přeložit posledni článek z února, abych dostál česko-anglické paritě a mohl jít dál.

Co tedy budeme dohánět?

23andMe konečně ohlásila, že bude převádět zahraniční účty bez zdravotních výsledků - takže Británie, Kanada a Dánsko maji zatím smůlu. (dnes, v říjnu, už je tedy převedeno vše).

Co nám tahle změna přinese? Trochu horší práci s našimi shodami :( To je na té přicházející změně asi nejhorší - nový vzhled a ovládání je směřováno na začátečníky a nenabízí takovou rychlost a důraz na výsledky, jako staré stranky. Navíc veledůležitý chrome plugin 529andYou nepracuje zcela automaticky, což bude při práci s velkým množstvím dat rozhodně chybět. 23andMe mám ze všech stránek nejradši právě kvůli výborným schopnostem pluginu 529andYou, který umožňuje ověřovat triangulační skupiny téměř bez námahy.

Na druhou stranu, máme na co se těšit:

  1. Souhlas s pozvánkama, hurá! Mám už asi 4 měsíce zabugovaný účet, neschopný odsouhlasit pozvánku od někoho jiného.
  2. Čtení a psaní zpráv! Dvakrát hurá!! Můj účet, asi kvůli velkému množství shod, už neumožňoval čtení nových zpráv. Má omluva všem co mi psaly a nikdy se nedočkali odpovědi. 
  3. Schopnost ozvat se anonymním shodám! Konečně se budeme zase schopní ozvat anonymním shodám. Často ani neví, že jsou "anonymní" a nemají žádný problém sdílet.
  4. Nová funkcionality In-Common-With - "společné shody". Tohle bude strašně důležitá nová vlastnost, která nám umožní rychle nahlédnout, kdo je s kým příbuzný.
  5. A spousta dalších drobnosti, jako například novější informace o můžských haplogrupách.

Rád bych využil téhle příležitosti, a vyslal ještě jednu vlnu pozvánek. Kdo ví jak budou věci vypadat. Jedna věc je jistá - schválené shody zůstavají schválenýma shodama i skrz přesun na nové stránky.
Takže zřejmě schválené shody = dobrá věc :)

Pokud jste náhodou má shoda, moc rád vám pomůžu s lepším porozuměním genetické genealogii - nebo s lepším porozuměním vašim středoevropským, především českým předkům.
I když vás nic z toho nezajímů, moc pomůžete výzkumu našich společných kořenu, pokud odsouhlasíte mou nabídku ke sdílení. Umožní mi to lépe stanovit triangulační skupiny, kusy DNA mě a mých shod z konkrétního společného předka. Sdílení mi umožní vidět jen ten malý kousek DNA, který sdílíme a nenese žádné bezpečnostní riziko.

Také bych rád udělal novou verzi naší série o sdílení. Jak se situace změnila od ledna?

Tady je porovnání s posledním loňským blogem:
DNA shodyAnonymníOdsouhlasené% odsouh.
já (Kuba)952 (+6)214 (-25)381 (+21)40.02%
matka854 (+9)239 (-32)311 (+25)36.42%
otec918 (+2)196 (-33)391 (+30)42.59%
bab. z m. strany1122 (+19)293 (-9)516 (+21)45.99%
bab. z o. strany925 (+5)241 (-34)337 (+11)36.43%
děd. z m. strany957 (+14)229 (-28)357 (+23)37.30%
manželka898 (+8)224 (-50)304 (+29)33.85%

Zajímavé, že všechny ty změny jsou bez jediné pozvánky.

A přesto se nám daři u některých profilů překonat magickou 40% hranice! Paráda.
Přestože je poslední dobou na 23andMe slyšet dost negativních reakci (na facebooku, různých fórech), já můžu směle říct, že počet shoda roste na úplně všech profilech.
A zároveň klesá počet anonýmních shod, často téměř rychlostí světla - když z manželčiného seznamu shod jich ubylo celých 50.

Vychází mi jednoduché pozorováni. Dokud budete své shody pozývat ke sdílení, statistiky budou vypadat pěkně. Budete mít víc a víc bratranců a sestřenic ke zkoumání.

Jak jsou na tom neodsouhlasené pozvánky? Podívejme se:


Šest zabugovaných pozvánek. Snad zůstanou i po přechodu.
A víc než tři a půl tisíce neodsouhlasených shod. Včetně těch nejbližších. Moc doufám, že tahle vlna pozvánek dokáže některé z mých shod zastihnout. Dostat to dolů na 3000 by bylo úžasné ;)

Ja bych se na to nové 23andMe díval s pozitivními emocemi. Čekají nás nové skvělé nástroje. Stejně jako staronová schopnost pozvat ke sdílení anonymní shody.

A v neposlední řadě teď tvrdě (jak jen čas dovolí) makám na rodokmenu, takže napojovat shody bude zase jednodušší. Doufám :D

Sunday, January 1, 2017

Stav rodokmenu na konci 2016

Ve svém vůbec prvním blogu jsem se moudře věnoval rodokmenům. Zcela neoddiskutovatelně se totiž jedná o nutnou podmínku práce každého "genetického genealoga" a je to pomůcka zdaleka nejdůležitější. Zdůrazňoval sem, že většina našich genetických shod budou naši "osmí bratranci/sestřenice", tedy potomci našich 7xpra dědečků/babiček. A proto potřebujeme kvalitní a hluboký strom.

Co jsem tedy dělal od prvního blogu v říjnu? Pravdou je, že jsem se spíš opět zabýval genetikou (e.g. série o shodách na 23andMe) a nepokročil tolik, kolik jsem doufal při psaní úvodního blogu.

Pojďme se na to podívat v tabulce:

gen#vztahshoda#předků v genmůj #idmbab#idmděd#idobab#idoděd#id
2děd1C444444
3pra2C888877
4prapra3C1616151614 (+3)14
53xpra4C32303032 (+1)22 (+4)26 (+1)
64xpra5C6459 (+3)49 (+1)38 (+4)2732 (+7)
75xpra6C128110 (+6)21 (+5)31 (+6)18 (+3)4 (+1)
86xpra7C256146 (+11)6 (+2)46 (+19)11 (+4)0
97xpra8C51274 (+15)4 (+3)43 (+15)10 (+4)0
108xpra9C102463 (+25)1 (+1)8 (+2)6 (+4)0

Alespoň nějaký pokrok naznačený čísly s plusy v závorkách jsem dokázal. 

Podívejme se nejprve na počet mých nalezenych předků v každé generaci do slabě fialového sloupce (můj #idd). Našim cílem je, aby tyto čísla byla stejná jako ta v tmavě fialovém sloupci (celkový počet předků v dané generaci). Až do sedmé generace se nám docela daří, ale pak čísla tragicky klesají. Je to hlavně způsobeno větší obtížností hledání předků před tolerančním patentem - tlustšími matrikami, neexistencí indexů, menším množstvím údajů v matrikách ale i větším množstvím předků celkově.
Jak už jsem říkali, naše shody budou nejčastěji s osmými brantranci (8C v modrém sloupci) a tam se nám podařilo identifikovat pohých 74 z 512 předků (ne nutně 512 různých osob, někteří naši předci jsou našimi vícenásobnými 7xpra). To jasně ukazuje jak obtížná a frustrujíci bude práce s našimi DNA shodami. Potřebuju na stromě proste ještě zamakat.

Doteď jsem zmiňoval výzkum předků pouze ze svého pohledu. Ve čtyřech bílích sloupčcích jsou pak údaje mých prarodičů (takže součet jejich 4 řádek koresponduje s mým, o dva řádky níže). Nejčastěji totiž pracuji se svými shodami z pohledu svých prarodičů (kde mám zmapovanou celou DNA). A zde je situace u 8mých bratranců naprosto tragická. Tady se prostě nedá očekávat, že budeme v hledání společných předků jakkoliv úspěšní.

Ač mě práce s DNA baví, je potřeba se zaměřit na rodokmen, práci s matrikami, a dalšími zdroji. A rozhodně se musím zaměřit na strom svého dědečka z otcovské strany (oděd v tabulce).

Pro 2017 bych si rád vytyčil dva cíle, co se mého rodokmenu a identifikace předků týče:
  1. Nalézt polovinu předků mého dědy z otcovy strany v 7mé generaci - tj. 64 mých prapraprapraprapra. Plán je to ambiciózní, neboť 64 v této generaci se neblížím ani u žádného z dalších prarodičů, ale je důležité, dávat si obtížné cíle. 
  2. Identifikovat 40% mých vlastních předků do 10té generace včetně. To znamené identifikace 818ti předků (z celkových 2046ti). Dnes jich [pravděpodobně] znám 512. To tedy znamená identifikovat dalších 306 nových předků v roce 2017.
Celkově bych se rád více věnoval rodokmenu, ale zůstal přitom aktivní i zde na blogu.

Thursday, December 29, 2016

Balancování - 2016 a shody na 23andMe

Tak nám končí další rok a ja bych ho rád shrnul i z hlediska (genetické) genealogie.
Jako prvním shrnu práci se shodama na 23andMe - jako pokračování našeho seriálu.

Co že to tedy znamená? 23andMe je americká společnost, která poskytuje jednotlivcům možnost nechat se geneticky otestovat. V roce 2014, kdy jsem začínal s výběrem to byla asi nejlepší volba. Proto tam mám stále hodně ze svých genetických dat.
U této společnosti musíme obdržet od každoho našeho DNA příbuzného (naší shody) souhlas. A ty nám otvírají možnost práce s daty.

Než začneme tak bych chtěl zmínit jeden výborný tip, který jsem dostal jako reakci na minulý blog.
Nesmíme zapomenout vysvětlit / zdůraznit, jak můžeme naší shodě pomoct my. Každý totiž přeci jen víc slyší na svůj vlastní prospěch, než na někoho jiného.

Jak si na tom tedy po měsíci stojíme se shodami a souhlasy na 23andMe?
Od listopadu se stala jedna velká změna. Konečně se mi povedlo s 23andMe vyřešit proces propojení výsledků mých rodičů s mým účtem. To velmi pomáhá při práci s daty. Pro jistotu připomenu, že už předtím jsem měl na účtu data 3 svých prarodičů. Ač by se tedy mohla zdát striktně lepší, opak je pravdou. Víc dat zde znamená více poznatků - více shod, více pozvánek na sdílení, více odhalených falešných (IBS) DNA segmentů, ...
Takže od teď budeme v našich přehledech uvádět i mé rodiče.

Zde je tedy stav z 28. prosince porovnávaný s 18. listopadem:

DNA shodyAnonymníOdsouhlasené% odsouhlas.
já (Kuba)946 (+20)239 (-20)360 (+30)38.05%
matka845 (+1)*271 (-16)*286 (+38)*33.85%
otec916 (+7)*229 (-13)*361 (+18)*39.41%
bab. z m. strany1103 (+26)302 (-21)495 (+21)44.88%
bab. z o. strany920 (+18)275 (-11)326 (+21)35.44%
děd z m. strany943 (+32)257 (-22)334 (+38)35.41%
žena890 (+8)274 (-21)275 (+16)30.90%
*rozdíly u rodičů jsou oproti 10. prosinci, pár dní po spojení účtů

Co to tu máme! Je zřejmé jak moc pomohlo přidání rodičů a pozvání jejich shod (bez jakéhokoliv průvodního dopisu, jen za použití 23andMe zpráv). Krásný pozitivní trend jako dělaný na ukončení 2016 statistik.

Nově jsem zařadil i statistiky o anonymních shodách, protože některé reakce na mé předchozí blogy (i jinde) predikovaly rostoucí trend anonymních shod, který já nikdy nepozoroval.
Naopak, je zřejmé, že i za měsíc je vidět značný pokles anonymních shod, dán jak tím, že někteří anonymové si zakládají veřejné profily, tak tím, že přecházejí na nové stranky 23andMe, kde můžou z funkcí na hledání přúbuzných zcela vypadnout a ze seznamu nám zmizet.
Rád bych ještě časem udělal blog věnující se speciálně anonymním shodám na 23andMe.

Nevýhodou dvou nových vzorků na našem účtu je nový nárůst počtu neodsouhlasených pozvánek:
Podaří se někdy tohle obří číslo (3500 pozvaných shod) značně snížit? Pravděpodobně ne :( Důležité však je, že i přesto, že toto číslo roste, se nám daří zvyšovat celkový počet známých shod, zvyšovat počet odsouhlasených shod, se kterými můžeme pracovat a snižovat počet anonymních shod.
23andMe má právě na svých stránkách chybu, neumožňující odsouhlasení těch 2 pozvánek, co vidíte na obrázku. O chybě nicméně vědí a pracují na jejím odstranění.

Rád bych napsal článek jaké mám cíle pro rok 2017, ale stojí za to zmínit něco i zde:
  1. Přesun na nové stránky TNE - nemůžů pro to sice nic udělat, ale pokud se to povede, tak se až zdvojnásobí celkový počet shod a budu schopen využívat Open Sharing - porovnání se shodami bez nutnosti odsouhlasení. To by oboje mělo velmi pomoct s dalším pokrytím genomu triangulačními skupinami.
  2. Dostat se u všech přes 40% odsouhlasených shod. A ideálně přes 50% u mně samotného.
To je prozatím vše - přeji jen to dobré v novém roce 2017!

Saturday, December 10, 2016

Práce s DNA shodama na 23andMe - pokračování

  Velké díky všem, kteří souhlasili se sdílením genetických dat. Nedá se říct, že by šlo jednoznačně o výhru, ale v kombinaci s vytvořením materiálu pro blog, lze pokus považovat za úspěch. Navíc určitě budou další hody přibývat v příštích dnech a týdnech.

  Takže 12. listopadu jsme začínali s 2793 neschválenými pozvánkami. Tohle číslo se nám do 19.11. podařilo snížit na:
2718. To není špatné. Bral bych samozřejmě radši 1900, 900 nebo úplně nejlépe 0, ale buďme realisté :D S tím, že na 23andMe nedokážeme využít celou databázi shod se prostě musí člověk smířit.

Tak jak se nám první týden dařilo na jednotlivých účtech? Podívejme se na to:
DNA shodyOdsouhlasenoOdsouhlaseno%
926 (+8)330 (+22)35.63714903
1077 (+1)474 (+13)44.01114206
902 (+4)305 (+14)33.81374723
914 (+3)296 (+17)32.38512035
886 (+4)259 (+31)29.23250564

Nepodařilo se nám úplně dosáhnout cíle 20/20/20/20/40, ale byli jsme docela blízko.

Stejně jako posledně jsou dobrá čísla u mého vlastního kitu výsledkem dvojitého pozývaní. Mé shody pozývam jak na mém vlastním tak na účtu prarodičů a rozdíl je znát (2 maily znamenají častější odpověď než jeden).

Jedna velmi důležitá věc, pro ty kteří to nevědí - když budou vaše shody souhlasit se sdílením genetických informací, budou se vám oběvovat nové shody - a to i takové, které jsou na platformě již dlouho dobu. Za poslední týden sem dostal mezi 0 a 2 zcela novými shodami na každém účtu, ale většině účtů přibylo nových shod víc. Práce se shodami a sdílení genetických informací pomůže zvýšit celkový počet shod v systému..

Nejde jen o to, kolik nových shod jsme získali. Podařilo se mi rovněž získat odsouhlasení vůbec nejbližší shody ze strany mého dědečka z otcovy strany. Pravděpodobně se jedná o "third cousin once removed" - "třetí sestřenici posunutou o generaci". Bohužel se mi nepodařilo s ní navázat kontakt. Zdá se, že shoda je na straně její maminky. Jedná se o krásnou shodu na 5 segmentech, která bude určitě v našem bádaní dlouhodobě užitečná.
Mám rovněž velkou hromadnu nezodpovězených zpráv, které můžou znamenat další odsouhlasené shody, potom co na včechny odepíšu.


Závěrem tedy je, že i pro "Východního" Evropana se dá soustavnou prací přiblížit využití 50% databáze společnosti 23andMe. I přesto, že našincům je zatím uzavřena možnost "Volného sdílení" - "Open Sharing", které umožňuje vidět genetickou shodu i bez sdílení. Při zběžné práci se shodami je normalní využití asi jedné třetiny databáze.
V budoucnu se ke shodám na 23andMe ještě určitě vrátíme.

Saturday, November 19, 2016

Jak přemluvit shody na 23andMe ke sdílení?

  Pod vlivem svého prvního blogu jsem teď trochu polevil v genetické genealogii a trochu víc (když čas dovolí) se věnuju rodokmenům.
  Za účelem tohoto blogu bych se rád vrátil na svou "domovskou" stránku - 23andMe, kde jsem otestoval nejvíc lidí a zpracoval nejvíc dat.

Mám tam téměř 2800 neodsouhlasených žádostí o sdílení DNA. Ano, DVA TISÍCE, teda spíš tři. Pěkná pruda... Jak pak má člověk dělat nějaké objevy?!

Co chci udělat - obeslat všechny shody, které mohu, žádostí o sdílení. A nakonec chci změřit úspěšnost tohoto pokusu.

Tak jak si na tom se shodama stojí mých 5 nejzajímavějších profilů?
DNA shodySdílející shody% sdíleno
já (Kuba)91830833.55119826
babička z máminy strany107646142.84386617
babička z tátovy strany89829132.40534521
děda z máminy strany91127930.62568606
manželka88222825.85034014

Jak vidíte, nejvíc jsem se věnoval shodám me babičky z mamčiny strany. Na shodách mé ženy jsem nepracoval o nic méně intenzivně, ale sebe a mou ženu jsem testoval až více než rok po prarodičích (a má vlastní čísla jsou důsledkem práce na prarodičích).

Co tak můžeme čekat? Budu rád, pokud se nám podaří získat 20 nových sdílení pro každého prarodiče (a s trochou štěstí 20 pro můj vlastní profil) and snad i 40 pro mou ženu.

Co uděláme? Napíšeme všem jednotný email. Napsat každému zvlášť by bylo skvělé, a zvýšilo naše šance, ale je možné to dělat opravdu jen s nejbližšími shodami. Psát osobní zprávu dvěma tisícum shod by bylo na rok.

Takže co hlavního budeme psát?

1. Kdo jsme - spousta Američanů má obavy, že se je někdo snaží podvést. Ustanovit přátelskou, rodinnou, důvěrnou atmosférou je základ.

2. O co nám jde (proto taky píšu tenhle blog, aby to bylo jasné).

3. Něco o naší rodině - veřejný odkaz na rodokmen, naše genetická data na gedmatch.com, ap.


Hello, 

my name is is Kuba Krchak and I am living in the Czech republic. I work as a computer scientist, with huge interest in genealogy, genetics, population genetics, next generation sequencing et.al. 

I maintain a blog bgengen.blogspot.com, where I just wrote about the struggle with matches on 23andMe. Please, check it out if you have a little bit of time. http://bgengen.blogspot.cz/2016/11/can-i-get-any-more-people-on-23andme-to.html

I am trying to work on the project of creating a recombination map for me and my family and eventually mapping the DNA to ancestors. 
You are one of my unshared matches and you accepting my sharing request would tremendously help me in my efforts.
I am eager to talk to you about your ancestry, but that is optional. Just accepting my sharing request is very valuable to me. 

Here is my basic public tree: www.wikitree.com/treewidget/Krchak-1/5 
My most up-to-date tree is http://krchak.myheritage.com
I also do have an ancestry tree: http://trees.ancestry.com/tree/82403601/family
My gedmatch ID is M240291. 

Best regards, 
Kuba 

Podle toho, o koho půjde jen pozměníme odkazy na strom a gedmatch. Aby lidé nemuseli sami hledat babičku ve stromě. Čím víc to můžeme ulehčit, tím lépe.

Tak pojďme do toho. Ozvu se asi za týden se shrnutím, jak se nám tahle kampaň povedla. Je nutné mít na paměti, že už jsme 30-40% shod měli. Pokud bychom začínali, tak je úspěšnost samozřejmě lepší.