Language switching

Saturday, December 31, 2016

How did I fare with my family tree research since starting the blog?

So the very first post on this blog wisely talked about family tree being the number one resource and prerequisite for a genetic genealogists work. We have stressed out how most of our DNA matches are probably 8th followed by 7th cousins. And we need a deep tree for that.

Well, the sad truth is I was more distracted elsewhere (e.g. 23andMe sharing series) and haven't done the progress I hoped for, when writing the initial blog post.

Here comes the comparison table:

gen#relmatch#anc/gen#idd me#idd mgm#idd mgf#idd pgm#idd pgf
2gp1C444444
3Ggp2C888877
4GGgp3C1616151614 (+3)14
53Ggp4C32303032 (+1)22 (+4)26 (+1)
64Ggp5C6459 (+3)49 (+1)38 (+4)2732 (+7)
75Ggp6C128110 (+6)21 (+5)31 (+6)18 (+3)4 (+1)
86Ggp7C256146 (+11)6 (+2)46 (+19)11 (+4)0
97Ggp8C51274 (+15)4 (+3)43 (+15)10 (+4)0
108Ggp9C102463 (+25)1 (+1)8 (+2)6 (+4)0

Thankfully, we have made some progress since the first post, signified by the little + numbers in brackets.
Let's first look at the number of my identified ancestors in the light purple (#idd me) column. Our final goal is to have all of the ancestors identified - for this light purple number to be equal to the darker purple number. Up till 7th generation, we're faring well, but then, the numbers fall of extremely rapidly.
We said most of our matches are likely 8th cousins (blue column) and we have still only identified 74 out of 512 possible ancestors. This clearly shows working with DNA matches is going to be frustrating! We need to improve our tree tree further!

Also, I was only talking about my own numbers, but in the 4 white columns, I have included my grandparent's point of view. This is because I am mostly working with DNA matches from the point of view of my grandparents. Here we can see the 8C level is abysmal. We just can't expect finding any common relatives at all, with the trees being so sparse.

Clearly, while I like the DNA work, it is time to sit by the parish records again, and do some serious heavy lifting. I need to call the target for my paternal grandfather (pgf in the table) again, and focus on it this time.

Let me try to shoot for two goals in 2017:
  1. Identify half of my paternal grandfather's 7th generation. I.e. 64 ancestors. This is an ambitious plan, as I have not reached 64 ancestors on this level for none of my other grandparents. But it is important to aim high.
  2. Identify 40% of my own overall ancestors up to the 10th generation. This means identifying 818 ancestors of mine (out of 2046). I currently [think I] know 512 of them. This means identifying 306 new ancestors of mine in the new year 2017.
All in all, I will try to keep active with the blog but focus on tree building efforts.

Thursday, December 29, 2016

Balancování - 2016 a shody na 23andMe

Tak nám končí další rok a ja bych ho rád shrnul i z hlediska (genetické) genealogie.
Jako prvním shrnu práci se shodama na 23andMe - jako pokračování našeho seriálu.

Co že to tedy znamená? 23andMe je americká společnost, která poskytuje jednotlivcům možnost nechat se geneticky otestovat. V roce 2014, kdy jsem začínal s výběrem to byla asi nejlepší volba. Proto tam mám stále hodně ze svých genetických dat.
U této společnosti musíme obdržet od každoho našeho DNA příbuzného (naší shody) souhlas. A ty nám otvírají možnost práce s daty.

Než začneme tak bych chtěl zmínit jeden výborný tip, který jsem dostal jako reakci na minulý blog.
Nesmíme zapomenout vysvětlit / zdůraznit, jak můžeme naší shodě pomoct my. Každý totiž přeci jen víc slyší na svůj vlastní prospěch, než na někoho jiného.

Jak si na tom tedy po měsíci stojíme se shodami a souhlasy na 23andMe?
Od listopadu se stala jedna velká změna. Konečně se mi povedlo s 23andMe vyřešit proces propojení výsledků mých rodičů s mým účtem. To velmi pomáhá při práci s daty. Pro jistotu připomenu, že už předtím jsem měl na účtu data 3 svých prarodičů. Ač by se tedy mohla zdát striktně lepší, opak je pravdou. Víc dat zde znamená více poznatků - více shod, více pozvánek na sdílení, více odhalených falešných (IBS) DNA segmentů, ...
Takže od teď budeme v našich přehledech uvádět i mé rodiče.

Zde je tedy stav z 28. prosince porovnávaný s 18. listopadem:

DNA shodyAnonymníOdsouhlasené% odsouhlas.
já (Kuba)946 (+20)239 (-20)360 (+30)38.05%
matka845 (+1)*271 (-16)*286 (+38)*33.85%
otec916 (+7)*229 (-13)*361 (+18)*39.41%
bab. z m. strany1103 (+26)302 (-21)495 (+21)44.88%
bab. z o. strany920 (+18)275 (-11)326 (+21)35.44%
děd z m. strany943 (+32)257 (-22)334 (+38)35.41%
žena890 (+8)274 (-21)275 (+16)30.90%
*rozdíly u rodičů jsou oproti 10. prosinci, pár dní po spojení účtů

Co to tu máme! Je zřejmé jak moc pomohlo přidání rodičů a pozvání jejich shod (bez jakéhokoliv průvodního dopisu, jen za použití 23andMe zpráv). Krásný pozitivní trend jako dělaný na ukončení 2016 statistik.

Nově jsem zařadil i statistiky o anonymních shodách, protože některé reakce na mé předchozí blogy (i jinde) predikovaly rostoucí trend anonymních shod, který já nikdy nepozoroval.
Naopak, je zřejmé, že i za měsíc je vidět značný pokles anonymních shod, dán jak tím, že někteří anonymové si zakládají veřejné profily, tak tím, že přecházejí na nové stranky 23andMe, kde můžou z funkcí na hledání přúbuzných zcela vypadnout a ze seznamu nám zmizet.
Rád bych ještě časem udělal blog věnující se speciálně anonymním shodám na 23andMe.

Nevýhodou dvou nových vzorků na našem účtu je nový nárůst počtu neodsouhlasených pozvánek:
Podaří se někdy tohle obří číslo (3500 pozvaných shod) značně snížit? Pravděpodobně ne :( Důležité však je, že i přesto, že toto číslo roste, se nám daří zvyšovat celkový počet známých shod, zvyšovat počet odsouhlasených shod, se kterými můžeme pracovat a snižovat počet anonymních shod.
23andMe má právě na svých stránkách chybu, neumožňující odsouhlasení těch 2 pozvánek, co vidíte na obrázku. O chybě nicméně vědí a pracují na jejím odstranění.

Rád bych napsal článek jaké mám cíle pro rok 2017, ale stojí za to zmínit něco i zde:
  1. Přesun na nové stránky TNE - nemůžů pro to sice nic udělat, ale pokud se to povede, tak se až zdvojnásobí celkový počet shod a budu schopen využívat Open Sharing - porovnání se shodami bez nutnosti odsouhlasení. To by oboje mělo velmi pomoct s dalším pokrytím genomu triangulačními skupinami.
  2. Dostat se u všech přes 40% odsouhlasených shod. A ideálně přes 50% u mně samotného.
To je prozatím vše - přeji jen to dobré v novém roce 2017!

State of the year - 23andMe matches

So here it is, yet another calendar year ending. A great time for balancing!
Let's continue with our 23andMe matches series. Please, allow me to present the end of year numbers.

Let me also mention one great tip I got as a reaction to my blog(s).
Do not forget to explain / stress out how sharing with you can be beneficial to the other party! We are not a world of altruistic beings after all, but everyone has their own agenda and goals.

So where do we stand with our 23andMe matches?
One big change happened on my account since November. Now I have both of my parents as part of this same account. This definitely helps in many aspects of genetic genealogy. To remind you, I already had 3 of my grandparents on the account. One might think that the grandparents supersede parents, but the truth is simply the more the merrier - more matches, more IBS uncovered, ...
From now on, we will start including my parents numbers to the table.

Let me compare against the last blog series from November 18th:

DNA matchesAnonymousAccepted% accepted
me (Kuba)946 (+20)239 (-20)360 (+30)38.05%
mother845 (+1)*271 (-16)*286 (+38)*33.85%
father916 (+7)*229 (-13)*361 (+18)*39.41%
m. grandma1103 (+26)302 (-21)495 (+21)44.88%
p. grandma920 (+18)275 (-11)326 (+21)35.44%
m. grandpa943 (+32)257 (-22)334 (+38)35.41%
wife890 (+8)274 (-21)275 (+16)30.90%
*mother and father differences are since Dec 10, few days after I merged them into a single account.

So what can we see here? Wow, what numbers! The effect of adding father and mother's kit and inviting (no letter apart from generic 23andMe message) everyone is much better than a hand prepared message! Such a positive end to 2016 here.

I newly included anonymous numbers, because many people were commenting on them based on the previous instalments of the series. You can clearly see, anonymous people are disappearing - either making themselves public or disappearing altogether after opting out on TNE ("the new experience" of 23andMe).
I will try to create a short article just covering the anonymous shares in a near future.

The disadvantage of the two additional accounts is more unaccepted outgoing invitations overall:
Will I be ever able to dwindle the number down significantly? Unlikely :( I am still clearly increasing my overall amount of matches, increasing my accepted shares and decreasing the amount of anonymous matches. So that's the most important thing.
Also there is a bug, disabling me from accepting the two pending invitations. Aaaargh. 23andMe know about it, though and are trying to fix it...

I want to create a single 2017 goals article, but let me state some bold goals relevant to 23andMe:
  1. Transition to the TNE - this will increase number of matches, introduce open sharing, which should both significantly help with number of known triangulation groups...
  2. Move over 40% of accepted shares on all accounts. Ideally breaking 50% on my kit.

Let me wrap it up here, wishing you all a great 2017.

Saturday, December 10, 2016

Nedávný výzkum otcovské linie

Můžete si o mě třeba myslet, že jsem držgrešle, ale rád neutrácím bezhlavě a za svoje peníze chci, co si zasloužím. Když jsem v říjnu uviděl slevu na yseq.net, konečně jsem se rozhoupal lépe prozkoumat svou otcovskou linii - Krcháky. Data z 23andMe (haploskupina I-M423) mě dovedly jen do doby před asi 14000 lety, kdy v Evropě ustupovali ledovce a náš předek tu byl lovcem a sběračem (zemědělství se začalo objevovat snad o 4 tisíce let později, v JV Evropě o šest, a u nás v té střední asi o 8 či víc).
Není pravda, že bych vůbec netušil co se mezi těmí 14000 a současností dělo. Docela silně jsem byl přesvědčen, že patříme do haploskupiny I-S17250 (https://www.yfull.com/tree/I-S17250/), která souvisí s expanzí (proto-)Slovanů z Černomořské a Kaspické stepi na západ.

Pro ostřílené borce DNA testování to může vypadat jako rouhání, ale stále ještě nemám žádné STR markery. Mělo by se to změnit příští rok, kde získám alespoň prvních 27 markerů, v rámci českého projektu Genetika a příjmení. Zatím tedy mohu pro patrání po otcovské linii a shodách používat jen snipy.

Co jsem se tedy dověděl na YSeq?
Je to pravda, Krcháci jsou I-S17250! Slované jak poleno. Teoretický výzkum na jedničku.
Ale pod tímhle snipem už byly mé dohady liché. Na základě výsledků jiných Čechů jsem předpokládal I-Z16971 nebo I-Z16983.

Jaké bylo mé překvapení, když jsem zjistil, že jsem I-Y4882! (https://www.yfull.com/tree/I-Y4882/)
A tedy, že Krcháci byli Východní, nikoliv Západní Slovani! Čas přepsat rodinou historii :D

Zatím jsem A1328- a A811-. Příští týden bych měl dostat výsledky pro A7358 a Y16473. Pokud bude vše negativní, ještě existuje nová větev A12505 k ověření. A jinak jsem úplně sám.

Nicméně v podstatě nezávisle na výsledku musím začít šetřit na Next Generation Sequencing test. Žádná z podvětví Y-4882 totiž není moc prozkoumaná, takže ať už do nějaké známe větve patřit budu, nebo ne, posunout dopředu se půjde jen co nejkompletnějším sekvenováním chromosomu Y.

Narrowing down my Y heritage

You can call me a cheapskate, but I just like to get my money's worth ;) Seeing a sale on yseq.net in October, I jumped on it, to finally get closer to present than I-M423's ~14000 years (I had from 23andMe).
Well what I say is not completely true, by looking around, I strongly suspected, I will belong to I-S17250 when tested (https://www.yfull.com/tree/I-S17250/).

This may seem like a heresy to the old-timers, but I still have no STR markers tested on my paternal line. Should change next year, with my first 27. So I only have SNPs to utilise in my Y-research so far.

So what have I learned at YSeq?
I was true, I am actually I-S17250! Good job figuring that one out.
But downstream, it was all miss, no hit. Based on other Czechs, I suspected I-Z16971 or I-Z16983.

What was my surprise to learn, I am actually I-Y4882! (https://www.yfull.com/tree/I-Y4882/)
This seems to be an East Slavic SNP, where I always saw my Krchaks as West Slavs till the last week. Time to change the family history :D

So far, I am A1328- and A811-. Next week should bring us results for A7358 and Y16473.
Based on that, if I am all negative, I still have a new A12505 to check.

Almost regardless of the result, I need to start saving for that NGS Y test though. None of the Y-4882 sub-branches is much explored, so either being placed in one of them or being an original one still leads to the same solution - NGS.

20 otázek pro genetické genealogy

Blaine T. Bettinger - autor knih o genetické genealogii a autor blogu http://thegeneticgenealogist.com/ - vytvořil následujících 20 otázek o publikoval je na ISOGG Facebook Group (mezinárodní skupině pro genetické genealogy na Facebooku). Rád bych zjistil, jak jsou na tom v tomhle ohledu Češi.

1. Kdo byl první člověk, kterému jsi dělal DNA test?
Všechny žijící prarodiče najednou.
2. Co byl tvůj vlastní první test?
Autozomální DNA na 23andMe.
3. Který rok jsi odebral svůj první test?
2013

4. Který je poslední test, co jsi udělal?
SNP balíček na 
yseq.net
5. Udělal jsi úplný test mitochondriální DNA na FamilyTreeDNA?
Ne.

6. Jaká je tvá mitochondriální haplogroupa?
T2b

7. Máš nějaké úplné mitochondriální shody?
nevím.

8. Jaký je maximální počet STR markerů, které jsi/tvůj mužský příbuzný testoval?
37

9. Jaká je Y haplogroupa tvého otce?
I-Y4882 (pod I-S17250)

10. Máš nějaké úplné Y shody? 
Ne

11. Testoval jsi na všech 3 největších testovacích společnostech? 
Ano

12. Nechal sis udělat test celého genomu?
Ne, ještě čekám, až cena víc spadne ;)
13. Kolik testů spravuješ? 
Asi 15
14. Používáš GEDmatch? 
Ano
15. Jaký je tvůj oblibený nástroj na GEDmatchi? 
Porovnání 1 na 1ho.
16. Dokázal si testovat své rodiče? 
Ano, oba.
17. Dokázal si testovat své prarodiče? 
Ano, 3.
18. Věk nejstarší osoby kterou jsi otestoval? 
89
19. Skončil jsi s testováním příbuzných? 
V žádném případě!
20. Kdyby si mohl požádat KTERÉHOKOLIV předka o test, koho by si požádal?
Asi mé nejbližší předky, děti otců neznámých - Antonína Šulu and Annu Chrenčíkovou, prapradědu a praprabábu.


Těším se, až si přečtu vaše odpovědi, klidně to zkuste tady pod blog :) Zde je prázdný seznam:
1. Kdo byl první člověk, kterému jsi dělal DNA test?
2. Co byl tvůj vlastní první test?
3. Který rok jsi odebral svůj první test?
4. Který je poslední test, co jsi udělal?
5. Udělal jsi úplný test mitochondriální DNA na FamilyTreeDNA?
6. Jaká je tvá mitochondriální haplogroupa?
7. Máš nějaké úplné mitochondriální shody?
8. Jaký je maximální počet STR markerů, které jsi/tvůj mužský příbuzný testoval?
9. Jaká je Y haplogroupa tvého otce?
10. Máš nějaké úplné Y shody? 
11. Testoval jsi na všech 3 největších testovacích společnostech? 
12. Nechal sis udělat test celého genomu?
13. Kolik testů spravuješ? 
14. Používáš GEDmatch? 
15. Jaký je tvůj oblibený nástroj na GEDmatchi? 
16. Dokázal si testovat své rodiče? 
17. Dokázal si testovat své prarodiče? 
18. Věk nejstarší osoby kterou jsi otestoval? 
19. Skončil jsi s testováním příbuzných? 
20. Kdyby si mohl požádat KTERÉHOKOLIV předka o test, koho by si požádal?

Blaine's 20 genetic genealogy questions

Blaine T. Bettinger - who recently published a genetic genealogy book and keeps a blog at http://thegeneticgenealogist.com/ - posted a 20 question list on the ISOGG Facebook Group - I specifically wanted to bring that to the Czech mutation of the site, but will keep bilinguality.

1. First person you DNA tested?
All living grandparents at once.
2. What was your own first test?
Autosomal at 23andMe.
3. Year you took your first test?
2013

4. What was your most recent test?
SNP pack at 
yseq.net
5. Have you done full mtDNA genome?
Nope.

6. What is your mtDNA Haplogroup?
T2b

7. Any exact mtDNA matches?
Do not know.

8. Max Y-DNA markers you/male relative tested?
37

9. What is your father’s Y-DNA Haplogroup?
I-Y4882 (downstream I-S17250)

10. Any exact Y-DNA matches? 
No

11. Tested at all of the Big 3 Companies? 
Yes

12. Have you had a whole-genome test?
No, waiting for the price to drop some more ;)
13. About how many tests do you control/administer? 
15
14. Do you use GEDmatch? 
Yes
15. Favorite GEDmatch tool? 
One-to-one comparison.
16. Were you able to test any of your parents? 
Yes, both.
17. Were you able to test any of your grandparents? 
Yes, 3.
18. Age of the oldest person you’ve tested? 
89
19. Are you all done testing relatives? 
NO!
20. If you could ask ANY one ancestor to test, living or dead, who would it be?
Perhaps my nearest ancestors, fathered by unknown person - Antonin Sula and Anna Chrencikova, both my great great grandparents.


Looking forward to read yours :) Here is the empty list (by Blaine):
1. First person you DNA tested?
2. What was your own first test?
3. Year you took your first test?

4. What was your most recent test?
5. Have you done full mtDNA genome?
6. What is your mtDNA Haplogroup?
7. Any exact mtDNA matches?
8. Max Y-DNA markers you/male relative tested?
9. What is your father’s Y-DNA Haplogroup?
10. Any exact Y-DNA matches?
11. Tested at all of the Big 3 Companies?
12. Have you had a whole-genome test?
13. About how many tests do you control/administer?
14. Do you use GEDmatch?
15. Favorite GEDmatch tool?
16. Were you able to test any of your parents?
17. Were you able to test any of your grandparents?
18. Age of the oldest person you’ve tested?
19. Are you all done testing relatives?
20. If you could ask ANY one ancestor to test, living or dead, who would it be?


Práce s DNA shodama na 23andMe - pokračování

  Velké díky všem, kteří souhlasili se sdílením genetických dat. Nedá se říct, že by šlo jednoznačně o výhru, ale v kombinaci s vytvořením materiálu pro blog, lze pokus považovat za úspěch. Navíc určitě budou další hody přibývat v příštích dnech a týdnech.

  Takže 12. listopadu jsme začínali s 2793 neschválenými pozvánkami. Tohle číslo se nám do 19.11. podařilo snížit na:
2718. To není špatné. Bral bych samozřejmě radši 1900, 900 nebo úplně nejlépe 0, ale buďme realisté :D S tím, že na 23andMe nedokážeme využít celou databázi shod se prostě musí člověk smířit.

Tak jak se nám první týden dařilo na jednotlivých účtech? Podívejme se na to:
DNA shodyOdsouhlasenoOdsouhlaseno%
926 (+8)330 (+22)35.63714903
1077 (+1)474 (+13)44.01114206
902 (+4)305 (+14)33.81374723
914 (+3)296 (+17)32.38512035
886 (+4)259 (+31)29.23250564

Nepodařilo se nám úplně dosáhnout cíle 20/20/20/20/40, ale byli jsme docela blízko.

Stejně jako posledně jsou dobrá čísla u mého vlastního kitu výsledkem dvojitého pozývaní. Mé shody pozývam jak na mém vlastním tak na účtu prarodičů a rozdíl je znát (2 maily znamenají častější odpověď než jeden).

Jedna velmi důležitá věc, pro ty kteří to nevědí - když budou vaše shody souhlasit se sdílením genetických informací, budou se vám oběvovat nové shody - a to i takové, které jsou na platformě již dlouho dobu. Za poslední týden sem dostal mezi 0 a 2 zcela novými shodami na každém účtu, ale většině účtů přibylo nových shod víc. Práce se shodami a sdílení genetických informací pomůže zvýšit celkový počet shod v systému..

Nejde jen o to, kolik nových shod jsme získali. Podařilo se mi rovněž získat odsouhlasení vůbec nejbližší shody ze strany mého dědečka z otcovy strany. Pravděpodobně se jedná o "third cousin once removed" - "třetí sestřenici posunutou o generaci". Bohužel se mi nepodařilo s ní navázat kontakt. Zdá se, že shoda je na straně její maminky. Jedná se o krásnou shodu na 5 segmentech, která bude určitě v našem bádaní dlouhodobě užitečná.
Mám rovněž velkou hromadnu nezodpovězených zpráv, které můžou znamenat další odsouhlasené shody, potom co na včechny odepíšu.


Závěrem tedy je, že i pro "Východního" Evropana se dá soustavnou prací přiblížit využití 50% databáze společnosti 23andMe. I přesto, že našincům je zatím uzavřena možnost "Volného sdílení" - "Open Sharing", které umožňuje vidět genetickou shodu i bez sdílení. Při zběžné práci se shodami je normalní využití asi jedné třetiny databáze.
V budoucnu se ke shodám na 23andMe ještě určitě vrátíme.