Language switching

Showing posts with label dna. Show all posts
Showing posts with label dna. Show all posts

Wednesday, November 29, 2017

Genetická genealogie pro začátečníky - Genetika a Příjmení - část 1

     Genetika a příjmení - část 1 - základy + hluboká minulost

Co jiného bych si mohl vybrat pro svůj první blog pro genetické genealogy začátečníky, než úspěšný český projekt "Genetika a Příjmení".

Že jste o něm ještě neslyšeli? Tak hybaj na stránky projektu. Tam se dovíte, že se jedná o projekt pro české (a hlavně prý moravské :) muže. Díky podpoře z grantů projekt umožňuje nechat si (na základě dostatečně zpracovaného rodokmenu) udělat zdarma základní STR test vašeho chromozomu Y. Tzn. nahlédnout trošku na kořeny vaší otcovské linie (otec otce otce otce otce ...).

Biologické a chemické stránce se budeme podrobněji věnovat v některém z dalších dílů, ale troška základů pro začátečníky. Chromozom Y je tzv. pohlavní chromozom, a má ho každý muž právě jednou (druhý pohlavní chromozom je X, který mají muži jednou, a ženy dvakrát).
Chromozom Y je specialní tím, že se jen s minimalními změnami (mutacemi) v každé generaci dědí z otce na syna.
A v době, kdy číst DNA nebylo vůbec jednoduché přišli vědci na zajímavý způsob jak změřit jak jsou si dva chromozomy Y vzdálené / blízké. Zjistili, že chromozom Y je protkán úseky, ve kterých se krátké kousky DNA (např. TCTA, ATT ap.) několikrát opakují - v angličtině "short tandem repeats", STRs. Takže když se podiváme na tyhle opakující se úseky, můžeme chromozom Y popsat. Např. se podíváme na dvanáct různých míst Y, 12 opakujících se kusů DNA - tzv. STR12.
Tím získáme sekvenci jako [14, 24, 15, 11, 14, 15, 11, 13, 13, 13, 11, 31].

Muže pak můžeme pomocí těchto počtů opakování STR porovnávat. Čím podobnější čísla, tím větší příbuznost.

A kolik těchhle STR čísílek člověk dostane z GAPu? 23. A kolik to teda vlastně je, dvacet tři? Inu, docela málo, člověku budou lehce vycházet jako genetické shody lidé, se kterými má společné předky třeba 2000 let v minulosti. Na tom není samo o sobě nic špatného, jen je třeba si to uvědomit, a s výsledky podle toho pracovat.

Tím jsme se oklikou dostali k tomu, co může člověk od výsledků čekat.

Jsou vlastně dvě hlavní kategorie.

1. Dávná minulost vaší otcovské linie. Díky tomu, jak se chromozom Y předává beze změn z otce na syna, je skvělou sondou do dávné minulosti vaší otcovské větve.
Umožňuje vám zjistit, kde vaši otcovští předci byli před 20ti, 10ti a pravděpodobně 2ma tisíci lety. (Ty 2 tisíce už vyžadují trochu štěstí a trochu práce).

Již docela dávno si lidé všimli, že ty STR čísla roztřiďují lidskou populaci do podobných tříd, tzv. "haploskupiny", nebo také haplogrup. Haplogrupy dostaly písmenka abecedy, kde úplně ta první, nejstarší, větev tzv. Y-chromozomálního Adama (praotce nás všech homo sapiens sapiens po otcovské linii) se jmenuje A. Velmi častá je skupina R, u nás pak druhá je skupina I.

Tyhle haploskupiny vlastně již tvoří strom (takový superhrubý rodokmen) našich otcovských linií:

(courtesy wikitree.com)

Tohle písmenko, pravděpodobně i s malým ocáskem dalších čísel a písmenek dostanete právě z GAP.
Tak hlavně, co ten ocásek? Je to vlastně docela jednoduché.
Písmenko vaší haplogrupy je první dělení. Představte si zjednodušeně, že to je váš prapra...prapraděda po otcovské linii.
Za písmenkem vždy následuje číslo, a za číslem zase písmenko.
Co tedy to první číslíčko znamená? Je to označení pořadí vaší podvětve, tedy zjednodušeně první syn (s unikátní mutací) ma číslo 1, třeba R1, druhý číslo 2, tj. R2, atd.
A v dalším kroku se zase jedná o větvení stromu (pořadí potomka), jen použijeme písmena, tj. R1a, R1b, atd.
Problém téhle notace je v tom, že se musela pořád předělávat, jak s dálším testováním přibývaly další větve. Takže se mohlo stát, že po chvíli se vaše I2b změnilo na I2a2 a pak na I2a2a atp.
Proto se dnes téměř bez výjimky přistupuje na notaci Jméno_haploskupiny-Jméno_SNP, např. I-M423.
A co je to teda to SNP? Česky čteme "snyp". SNP je "single nucleotide polymorphism" - místo v DNA, které může nabývat víc hodnot. Např. na pozici 16984211 máte třeba písmenko G nebo A. Pokud máte A, a jste právě v haplogrupě I, jste M423-pozitivní.
Pomocí těchto SNiPů se pak dá vybudovat ještě lepší strom, než pomocí STR.
Na jeden takový se můžete podívat na https://www.yfull.com/tree/.

Tak teď už snad trošku víte, co znamenají ta písmenka a čísla a můžeme se podívat na tu minulost.
Na české wikipedii je úplně strašně malinký popisek, ale je česky.

Zdaleka nejlepší místo, kam se podívat, pokud jen trošku ovládate angličtinu, nebo jste ochotni podstouput strojový překlad Googlu, je eupedia.com.
Tam naleznete velmi pěkné množství aktuálního materiálu, které by vám mělo dát do začátku rozumnou představu, kdo byli ti vaši otcovští předci zač.

Příště bychom se v části 2 podívali na tu druhou kategorii výsledků, naše Y-DNA shody. A v důsledku se pomocí nich zase vrátili k dnešní kategorii, dávné minulosti.

Pokud si chcete o GaP popovídat, neváhejte využít komentářů k blogu, nebo českých genealogických fór taby.cz a nebo klub na okoun.cz


Jo, a mimochodem, pokud se chcete GaP zúčastnit, tady je vstupní formulář: http://www.genebaze.cz/cgi-bin/gap/gap_ud.cgi

Monday, November 6, 2017

Vít, nový Krchák na světě!

Srdečné pozdravy všem čtenářům. Přijměte prosím mou omluvu za dlouho odmlku. Zmiňoval jsem se už, že vést dvojjazyčný blog je dvakrát víc práce než jednojazyčný blog?
A propos, už jsem zmiňoval, že tři děcka jsou vlastně jako dvě děcka, až na to, že na koníčky máte teda rozhodně míň času než dřív?

Nu což, vzhůru do práce. Nejste tady, aby jste poslouchali, jak si stěžuju.

Takže Vít. Vítek Krchák. Třetí v této (~2010) generaci Českých Krcháků. Po pravdě nic moc. Zdá se, že Krcháci v Čechách do pár generací vymřou.

A kdo tedy jsme? My chlapi, Krcháci? Z Horňácka, jihovýchodní Moravy, kraje chudého, ale na tradice bohatého? Mé první nakouknutí na naši otcovskou linii se odehrálo pomocí autozomálního testu u 23andMe, verze 4. Ten obsahoval několik tisíc SNiPů na Y chromozomu.


Podle jejich starého způsobu značení jsem byl I2b*. Nicméně trošká výzkumu proti Y stromu na ISOGG ukázala, že jsem ve skutečnosti větev I-M423, tedy I2a1b starou notací. Větev původních Evropských lovců a sběračů - Evropan jak poleno :D
23andMe nabízí o Y haplogrupách vlastní povídání, ale zdaleka nejlepší info jsem se dočetl na eupedii. Hlavně tam jsem se dověděl o základní historii I-M423.

Po trošce průzkumu jsem jasně viděl, že SNiPy jsou na výzkum chromozomu Y mnohem mocnější zbraň, než STRka. Díky jednoznačnosti a bohatější struktuře. Jako další krok jsem si tedy vybral I-M423 panel na yseq.net. To je Y test s daleka nejlepším poměrem cena výkon na trhu (pokud znáte svoji haplogrupu), a tým z yseq.net dělá vše proto, abych jejich panely zahrnovi vždy ty nejnovější známé mutace. Velká chvála Thomasovi Krahnovi.
Výsledky panelu mi poskytly mou "konečnou" (z hlediska dosud dosažených znalostí o Y stromě) SNP mutaci I-Y16473 and 4 nejbližší shody - Narog, Telencio, Rohaly and Girya. Polsko, Polsko, Maďarsko a Ukrajina. Nejbližsí společný předek 200 n.l. Expanze Slovanů na západ!
Úžasné.
Být schopen si spojit mutaci I-S17250 a její nejbližší podtřídy tak zřejmě se Slovanským stěhováním národů v první polovině prvního tisíciletí našeho letopočtu byl jeden z nejlepších výsledků, co jsem zatím z genetického testování dokázal vymáčknout.



Dalším krůčkem ve výzkumu mé Krchákovské linie bylo dohánět co jsem zanedbal - malý STR test. Ten jsem uskutečnil pomocí unikátního českého projektu "Genetika a příjmení", které se snaží mapovat česká příjmení na haplogrupy - genebaze.cz/gap.html. Pokud jste to ještě nezkusili, rozhodně se ozvěte! Je to úžasný způsob jak zadarmo s genetickým testováním začít.
Tak co jsem se dověděl? Jak by mohl malinký STR panel dodat nějakou informaci k SNP testu, obsahujícím všechny nejnovější větve? Jednoduše. Všude je TOLIK genealogů, kteří si nechali udělat jen STR test. Takže ač je SNP testování rozhodně mocnější co se týče časové umístění vašich shod a vytvoření stromu otcovských linií, neměli by jste STRka rozhodně zcela vynechat - umožní vám získat další (trochu neurčité) shody.
V mém případě to znamenalo nějaké blízké Slovenské shody, které žadné SNP testování nepodnikly. To krásně podpořilo rodinou legendu, že Krcháci přišli na Horňácko ze Slovenska.
(To je navíc dále podpořeno Slovenskými autozomálními shodami na čtvrtine DNA od mého dědečka Krcháka.)
Macák. Orava. Doufám, že jednou je na SNP test nalákam.
Moje IDčko na ysearch.org je AH7EK. Rovněž rovázané s mým WikiTree účtem.

Jak vždy říkám, jsou dvě cesty kterýma se může člověk ve světě Y-DNA vydat. Aktivní nebo pasivní.
Pasivní znamená čekat, až vaše shody absolvují všemožné testy, až vám vydláždí cestu. Je to ta levnější cesta. Ale možná vás nikam nedostane.
Aktivní znamená konat! Udělat si sekvenování chromozomu Y. Najít vaše nové mutace. Spolupracovat s testovacíma společnostma, aby jste vaše soukromé SNiPy dostale jak do panelů, tak do dlouhých seznamů testů na samostatné SNiPy. Pracovat s vašimi shodami, zda nemají některé vaše mutace společné. Snažit se navnadit vzdálené bratrance, aby se do toho sekvenování taky pustili. Tohle je mnohem dražší varianta, ale povede k výsledkům mnohem pravděpodobněji, v mnohem kratším čase.

Ja si samozřejmě vybral tu aktivní cestu. Takže můj další krok byl logicky BigY test of FTDNA. Nebo ne?

Aby jste si od FTDNA mohli koupit BigY test, musíte u nich první otestovat nějaké STRka. Ono je to nakonec asi v pořádku, protože nikdo nechce utratit 400 dolarů, aby zjistil, že jeho bratranec měl ve skutečnosti adoptovaného pradědečka.
Pomocí projektu je možné si objednat 12STR, aby člověk minimalizoval náklady. Ale když už se má člověk do té FTDNA STR databáze dostat, tak ať ty shody stojí zato. Začal jsem raději rovnou s 37STR indikátory. Tedy asi 15 navíc proti těm co už jsem měl z GaP.

Stálo to za to? Ani ne. Šel bych do těch 37mi radši než do 12ti znova? To zas jo.
Problém je, jak přísný limit na shody FTDNA na úrovni 37STR indikátorů má. Snaží se motivovat lidi ke koupi 67mičkových a 111kových panelů. Je to hnusná vydírací taktika, ale holt to tak je. FTDNA si na živobytí vydělává hlavně pomocí STR testů, a vždycky se snažila tu být předně pro genetické genealogy (ne jako některé jiné společnosti, kterým jde opravdu jen o zisk).
Takže 37STR test žádné nové poznatky nepřinesl, ale vždycky může zkoušet všechny své blízké STr shody přesvědčovat na BigY test.

Se splněnou podmínkou v podobě STR testu byl BigY konečně na dohled. Akorát byl dál, než to vypadalo. Několik odložených slíbených časů dodávky, a déle než 3 měsíce čekání... Ale když jsem se konečně dočkal tak to rozhodně stálo za to.

Nová finální větev s mou shodou - Larrym Telenciem. I-FGC40352. Paráda. Skvělé. Úžasné. Takhle se tvoří Y strom.
Navíc jsem dostal 8 soukromých mutací, které teď čekají na další shody.
Potenciál pro další výzkum, blíže současnosti. Sem s ním!

A tím se jako s testováním skončil? Ne tak úplně. Sekvenování je známé nelehkostí interpretace. A FTDNA to dělá obzvlášť blbě. Proto taky většina lidí, která Yové sekvenování podstoupí, jde o krok dál. Objedná si detailní analýzu souboru BAM za 49$ na https://www.yfull.com.
Tam se výsledky dostávají postupně:

  1. SNP výsledky - tohle je podstata analýzy, najív nové finální listy v Y stromě a identifikovat vaše soukromé mutace (a míru jejich spolehlivosti).
  2. STR výsledky - několik stovek STRek, které se dají pomocí NGS přečíst. A taky STR shody.
  3. nový Y strom - vám konečně ukáže vaši novou, vysněnou větev Yového stromu s vaší soukromou mutací - a odhadem jejího stáří.
Tak jsem s tím výzkumém Y chromozomu, co můj syn ponese dál do budoucnosti, docela pokročil, ale stále je kam jít.

Přesvědčit blízké shody, aby rovněž absolvovali sekvenování chromozomu Y, a nebo alespoň otestovali přítomnost mých soukromých mutací v jejich DNA. Snad se mi to u některých (z Vás) podaří.
Koupit BigY pro známé vzdálené bratrance po otcovské linii, abychom lépe definovali, které z mých soukromých SNiPů jsou ty starší. A rovněž za účelem umístění Krchákovské větve na rozličné Y stromy (YFull, ISOGG, FTDNA).

Další rok, další krok kupředu. Už se těším co se na poli Y výzkumu dovím v roce 2018.

Jo a taky si můžu odškrtnout můj první cíl ze seznamu na rok 2017. Uff.

Tuesday, October 31, 2017

Vitus, new Krchak introduced into the world!

Hello everyone and sorry for the prolonged hiatus. Did I ever mention that maintaining a bilingual blog is twice the work of maintaining a single language blog?
Also, did I ever mention that taking care of three kids is almost the same like taking care of two, but it still means you will have even less time for your hobbies as a result?

Well, let's get to work then. You aren't here to hear me complain!

So Vitus. Vitus Krchak. Third in this generation (~2010 generation) of Czech Krchaks. We are on the verge of extinction.

So who are we? Male Krchaks? Coming from Hornacko region, in south east Moravia? I started glimpsing into the paternal linage by taking the 23andMe autosomal V4 test, that included several thousand Y chromosome SNPs.


I was denoted I2b* branch, but some small research against the ISOGG Y tree revealed I am actually I-M423, I2a1b branch.
23andMe offers some haplogroup history write-up on their own, but the best source is probably eupedia. There, I learned about the basic I-M423 history.

I clearly saw that SNPs are so much more powerful for Y research than STRs and chose the next step as a I-M423 panel at yseq.net. This is a great price performance ratio, and the yseq.net team goes out of their way to always keep their panels updated with latest developments. Big kudos to Thomas Krahn and team.
This offered me my terminal SNP of I-Y16473 and 4 closest matches - Narog, Telencio, Rohaly and Girya. Poland, Poland, Hungary and Ukraine. Most recent ancestor 200AD. Slavic expansion!
Awesome.
To be able to identify the I-S17250 and it's nearest subclades so clearly with the Slavic expansion in early centuries of AD was a great feeling and justification of the testing effort.



The next step in my Krchak lineage research was a small STR test. This was done for free thanks to a great Czech project "Genealogy and surnames", which tries to map various surnames to haplogroups - genebaze.cz/gap.html (Czech only).
So what did I learn there? How could a small STR test add something to state-of-the-art SNP test? Easily. There SO MANY genealogists, that have only done STR testing, that while SNP testing is superior, to provide better timeline and paternal tree, you should not omit STRs.
In my case, this meant some close Slovak matches, that have not done SNP testing, that hint at correctness of the family lore, that Krchaks came to Hornacko region from Slovakia.
(This is further strengthened but quite close Slovak autosomal matches on my paternal grandfather "quarter" of my DNA.)
Macak. Orava. I hope I will get them to test some SNPs one day.
The ID on ysearch.org is AH7EK. Which is also linked to my WikiTree account.

As I always say, there are two approaches, you can take with your Y reseach. Active or passive.
Passive means waiting, for your matches to test, for them to pave you the SNP way. It is the cheaper road. Yet, it may never get you anywhere.
Active means acting. Testing that NGS Y chromosome test. Finding your novel SNPs. Working with the testing companies to get some of them on their panels and their single SNP tests. Working with your matches to try to verify if they have any of these SNPs common with you. Trying to motivate your distant cousins to do a NGS Y chromosome test too. This will be (much) more expensive but will lead to results so much more likely so much faster.

Of course I choose the active path, so here I was, buying a Big Y test from FTDNA. Or was I?

FTDNA requires you to purchase a STR test, before buying a BigY test. This is probably fair, because you don't want to spend 400$ on your cousin to find he was a NPE.
You can order a 12STR test through a project, to save most money, but I wanted to tackle FTDNA STR database and went for 37STR markers. This added roughly 15 on top of what I had from GAP.

Was it worth it? Not much. Would I do it again? Yes.
The FTDNA limit for matches on 37STR level on FTDNA is very strict to motivate you to purchase 67 or 111 panel. I consider this an ugly money-poaching tactic, but it is, what it is.
FTDNA earns their living off of STR testing after all.

Nothing tangible I got from the 37STR test, but there is always a chance to persuade some of my matches to test BigY. Study modal STR values on various SNP levels, etc.


With the STR test out of my way, the BigY was finally in sight. Except it was further than it seemed, taking over 3 months... Eventually, the test happened, and boy did it deliver.

New terminal SNP with my match Larry Telencio. I-FGC40352. Super awesome. Super exciting. Y-tree in the making.
On top of that I got 8 unnamed variants (that actually included two named SNPs, but nevermind).
Potential for further research closer to present. Give it to me!

Was I done? Not yet. The NGS test are notoriously hard to analyze. And FTDNA does not do a very good job. That is why everyone who takes Y research seriously goes one step further and orders detailed analysis of his BAM file for 49$ on https://www.yfull.com.
There are three milestones:

  1. SNP results - this is the foundation of the analysis, finding any new terminal SNPs
  2. STR results - this offers a more profound look at the STR landscape
  3. new Tree being published - this finally offers the age estimate of your new terminal SNP

All in all, I am fairly advanced in terms of my Y research, that my son will carry.
Still, more things remain.

Persuading close matches to test BigY or my novel SNPs. I hope I will succeed with some of them (you).
Buying BigY for known distant cousins so that we can better define the older novel SNPs and the most recent one, as well as get the branch on various trees (YFull, ISOGG, FTDNA).

Another year, another step forward. I am looking forward to learning more in 2018.

Friday, February 24, 2017

23andMe move to the New Experience coming!


So 23andMe has finally gotten to transitioning foreign accounts WITHOUT health information - sorry UK, Canada or Denmark.

What will it bring? Worse ability to work with DNA relatives :( That's the biggest bummer, the new interface is more newbie oriented and does not offer as quick and outcome oriented  capabilities as the old one. Also, the 529andYou chrome plugin does not work perfectly (at least yet), that is going to be a big downside. I only like 23andMe most to work with, because of the powerful plugin 529andYou made work with triangulations so effortless.

On the other hand, we have a lot to look for.

  1. Accepting invitations, yay! Yes I had my account bugged for maybe 4 months now, unable to accept any invitations from others.
  2. Reading and writing messages! Yipeee!! Again, my account, due to it's size, probably, was no longer able to read new messages from people. Sorry everyone! 
  3. Contacting Anonymous matches! Finally, we will be able to contact anonymous people again. They often do not know they are anonymous and are perfectly fine with sharing.
  4. New In-Common-With functionality. Huge! I am so looking forward to learning where do my anonymous matches fit. And others as well.
  5. All other little nice things like updated male haplogroups.

I want to take this opportunity to run one last invitation wave on the old site. Who knows how things will be, and one thing is clear. Any matches you have persist through the transition.
So clearly matches = good :)

If you are my match checking up here, I would love to help you understand genetic genealogy or be able to understand your Central European, or even Czech ancestry better.
Still, if you are not interested in any of that, and can just approve my sharing request, that will help me a bunch in my family research. It will enable me to better define triangulations, portions of my and my matches' DNA coming from a specific ancestor. This will only show me a very small portion of the DNA we share and poses no security risk.

I would also like to do an update to my matches series. Where did we get since January first?

Let me compare against the last blog series from December 28th:


DNA matchesAnonymousAccepted% accepted
me (Kuba)952 (+6)214 (-25)381 (+21)40.02%
mother854 (+9)239 (-32)311 (+25)36.42%
father918 (+2)196 (-33)391 (+30)42.59%
m. grandma1122 (+19)293 (-9)516 (+21)45.99%
p. grandma925 (+5)241 (-34)337 (+11)36.43%
m. grandpa957 (+14)229 (-28)357 (+23)37.30%
wife898 (+8)224 (-50)304 (+29)33.85%

What is important to say, is that this was without any invitation messages being written. Nada.

And we're still breaking the magical 40% accepted on some kits already! Sweet.
Despite the negative sentiment everywhere (facebook, forums), I can still report number of matches growing on ALL of my kits.
WHILE, number of anonymous matches dropping, sometimes at a speed of light - 50 anonymous matches disappearing from my wife's list. WOW.

Simple observation. As long as you keep inviting your relatives to share, you should be good. See more and more cousins to research.

So where are we with unaccepted matches? Let's see:


Hm, 6 bugged invitations. Hope they stay for the TNE.
And over three and half thousands of unaccepted invitations. Including some of the closest ones. I sure hope this invitation round will reach to some of these cousins. Getting down to 3000 would be awesome ;)

So let's look forward to the New Experience with positive attitude. There are some great new features in there. As well as a renewed possibility to connect with anonymous matches.

And last but not least, I am working on my tree hard (as time permits) so I can find a connection for all of these new matches :)

Sunday, January 1, 2017

Goals for 2017

First and foremost: Happy New Year! 🎉🎉🎉 May you all have a very successful 2017 with lot of genealogical successes, uncovered DNA cousins and healthy family members.

A new year is a great time for tidying up and starting afresh with new vigor.

So what are the goals I want to achieve? I have already mentioned some of them in my last two blogs, but I will incorporate those into the overall list with order by importance.



    1. Have a healthy son introduced into the world. Yay! This is not strictly genealogical, nor strictly genetical, but taking care of my newborn son will be a great experience in 2017. It will take away some of my free time - so excuse in me in times of silence. Importantly, here comes a huge thank you to my wife, for being such an excellent person and mother. Love you, honey 💖
    2. Improve the family tree. This has subgoals as per the latest 2016 balancing blog.

      2.1. Identify 40% of my own overall ancestors up to the 10th generation. This means identifying 818 ancestors of mine (out of 2046). I currently [think I] know 512 of them. This means identifying 306 new ancestors of mine in the new year 2017.

      2.2. Identify half of my paternal grandfather's 7th generation. I.e. 64 ancestors. This is an ambitious plan, as I have not reached 64 ancestors on this level for none of my other grandparents. But it is important to aim high.
    3. Run a Czech series for newbies in genetic genealogy. (This will probably be Czech only - there is a lot of existing English material and maintaining bilinguality costs a lot of time and energy).
    4. Break one or both of my closest brick walls. One of my paternal grandmother's great-grandfathers is unknown, as well as one of my paternal grandfather's great-grandfathers. Attacking them with autosomal DNA was the goal from the beginning, so identifying one or both of them would be a tremendous achievement.

      4.1. This includes a sub-goal of gathering as much relevant samples from those sides of the family as possible.

      4.2. Work on recombination map and chromosome ancestral coverage on my paternal side.
    5. Test my own children. We have agreed with my wife to test the children, so looking into what's the best option and going through with it is one of the topics of 2017.
    6. Start an "Ancestor of the week" feature - were I blog about one of my ancestors. I expect only a few of these throughout the year
    7. Keep working with my genetic genealogy matches (this includes 23andMe matches and the relevant goal mentioned in the recent 2016 balancing blog).
    I have more on my mind, but let's keep it at 7. I will try to address each and every one of these goals, with the priority going top to bottom.

    Saturday, November 19, 2016

    Nové Y-ové haplogroupy na 23andMe

    Tenhle týden se nám dostalo nového hezkého update od 23andMe. Máme teď k dispozici Y haploskupiny založené na snipech - alternativních DNA bazích. Bohužel se tahle novinka dostala jen na jejich nové stránky (a tam zatím Evropany nepouštějí).

    Tady to podrobně popisují v blogu: https://blog.23andme.com/ancestry/updates-to-23andme-paternal-haplogroup-assignments/

    My se zaměříme na podstatu změny.
    Na začátku se Y strom tvořil pomocí písmen a číslic. Pokud jsme měli nějakou haplogrupu, např. R, tak první rozvětvení jsme označili jedničkou, další dvojkou, atd.: R1, R2. Pro další větvení jsme použili písmena - R1a, R1b, a pak zase čísla R1a1, R1a2 atd.
    Problém byl v tom, že nalezení nových dělení nám mohlo (a typicky taky dělalo) tyhle větvení přeházet. Čím blíže současnosti, tím víc se vše měnilo a nebylo stabilni.
    Proto jsme zavedli definici pomocí snipů - ty označují, která konkrátní mutace k danému větvení vedla. Pokud došlo mutací na pozici L160 k vytvoření nové větve, je jedno jestli je třetí nebo patá. Tohle značení je mnohem stabilnější.

    A tohle tedy David Poznikskvělý výzkumník chromozomu Y, na 23andMe zavedl.
    Obnovil údaje na úroveň ledna 2016, pomocí ISOGG stromu.

    Nyní tedy každý uvidí, jak vypadá jeho kousek Y linie:

    Tohle hlavně zamezí zmatkům. Ani nevíte, kolikrát přišel do našeho FTDNA projektu nebo Facebookové skupiny někdo zcela popletený výsledky z 23andMe.

    Rovněž bude mnohem jednodušší pomocí 23andMe výsledků objednat ten správný SNP panel z FTDNA nebo YSeq.

    Skvělá práce od Davida, těším se, že o něm neslyšíme naposledy!
    (pro technicky znalé - můžete se podívat na jeho prográmek, kterým výsledky zaktualizoval)

    Saturday, November 12, 2016

    MyHeritage begins it's own DNA autosomal testing!

      Wow! What a surprise! Just a few days after working out their DNA matching, MyHeritage is starting their own autosomal DNA testing.

    Here is the official announcement: http://blog.myheritage.com/2016/11/introducing-myheritage-dna/
    So what do we have here, compared to the market?

    MH is using a stadnard autosomal chip of roughly 700 000 SNPs. Pretty much state of the art for autosomal genotyping. The only difference is that both 23andMe and Ancestry (v2) have more health related SNPs on their chips. If you care mostly for genealogy, though, that is not much of a problem.

    MH is using the Gene By Gene lab, same one that FamilyTreeDNA does. There's no need to worry. GeneByGene is an excellent, well known lab with good reputation.

    The price is very competitive too!

    You will be able to download your raw data and use it at the local suspects:
    gedmatch.com for genetic matching and additional ancestral estimates,
    promethease.com for health information,
    and dna.land for both, and more.

    So is it worth testing at MyHeritage?
    Well if you have testing anywhere else, don't do it (just yet)! (Unless you want to learn about the system so you can teach others, but than you don't need my advice anyway ;).
    You can upload your raw data from anywhere and come up with the same result, without paying anything. The only thing you're loosing out on is the ancestral coverage, and that is not worth 79$, period.

    But if you haven't tested anywhere yet? I would still start elsewhere. Not sure where though, as Ancestry->FTDNA transfer no longer works. Thinking about it more, I would do either 23andMe or FTDNA if I were doing my first test.
    I hate the lack of chromosome browser at Ancestry, that just completely invalidates their large DB in my eyes.
    Well feel free to ask in the comments, I'm glad to help!


    Bibliography: Some info was taken from http://blog.myheritage.com/2016/11/myheritage-dna-your-questions-answered/

    MyHeritage rozjíždí vlastní autozomální testovaní DNA

      Něco co jsem rozhodně nečekal! Jen několik dní po zprovoznění DNA shod rozjíždí MyHeritage i vlastní DNA testování.

    Tady je odkaz na (anglické) oficiální prohlášení: http://blog.myheritage.com/2016/11/introducing-myheritage-dna/
    My si to samozřejmě projdeme pěkně popořádku v češtině.

    Hlavně - co od toho můžete očekávat?

    Předně genetické shody! Ty vám pomůžou:
    1. potvrdit svůj strom - ať si faráři píšou co chtějí, dokud příbuznost neověříte DNA, máte jen domněnku.
    2. máte někde v rodokmenu otce neznámé? Pomocí DNA můžete zjistit, kdo to byl!
    3. chybí někde dokumenty? I to se s troškou štěstí dá pomocí DNA prorazit.
    4. nemůžete přijít na to, odkud se váš předek přistěhoval? Sem s DNA :)

    A potom, také zajímavý, je rozklad na jednotlivé populace.

    Jste jen východní Evropan? Slovan jak poleno?
    Nebo snad máte hodně západní krve? Ostsiedlung? Germáni?
    A co třeba nějaká ta židovská DNA? Odkud se ve vás bere? I to se dá dohledat.




    Chcete-li se na cokoliv zeptat, neváhejte! Rád pomůžu.

    A teď podrobněji.

    Jedná se o stadnardní autozomální chip o cca 700000 snipech. To jest dostanete přibližně to, co jinde. Jediný rozdíl je, že na 23andMe a Ancestry (v2) dostanete o něco více zajímavých zdravotních snipů. Nicméně pokud vás víc zajímá genealogie, není to žádný velký problém.

    Laboratoř MH používá americké Gene By Gene, tedy stejnou laboratoř jako FamilyTreeDNA. Rozhodně není tedy potřeba se bát. Jedná se o kvalitní, známou a dlouhou dobu zajetou firmu.

    Cena je velmi konkurenceschopná.

    Data si budete moci stáhnout a použít i jinde.
    gedmatch.com pro genetické shody.
    promethease.com pro zdravotní informace.
    dna.land pro obojí.

    Myslím, že pro našince velmi zajímavé. MyHeritage totiž na rozdíl od všech ostatních zvládne prezentaci v češtině!

    Takže pokud jste ještě DNA test nedělali, ale uvažovali o něm, jděte do toho! Ukáže a odhalí věci, které nikdy v žádných matrikách nenajdete.

    Bibliografie: Některé informace jsem čerpal z http://blog.myheritage.com/2016/11/myheritage-dna-your-questions-answered/

    Saturday, November 5, 2016

    DNA shody na MyHeritage již fungují!


      Dobré zprávy, obzvláště v našich zemích, kde MyHeritage je jednička na trhu. Po dvou měsících úvodního provozu přišel tolik očekávaný update a hledání DNA shod na MyHeritage nyní funguje. Tady je blog, kde ohlašují, že se už od 3. listopadu nepovažují za "betu" (testovací provoz).  Podíváme se na to podrobněji.


      Úvodní nastavení genetických shod bylo velmi volné. Každý viděl stovky a stovky údajných bratranců a sestřenic, ale při ověřování na gedmatch.com to byly všechny mylné shody. Tohle chování je naštěstí opravdu pryč. Nicméně skákat do stropu radostí není na místě - z velmi benevolentního systému se stal nejpřísnější konzervativec široko daleko. Můžeme se tedy těšit ze shod, kterým se dá důvěřovat, ale moc jich (alespoň zatím) nebude.


    Tady jsou počty genetických shod, které systém nabízí pro mě a mou rodinu:
    Já:  1 single match (with no associated tree)
    Rodiče: 5, 1 
    Prarodiče (3 které jsem testoval): 3, 0, 3
    Manželka: 5

    Důvěryhodnost zvyšuje, že nejednu z těchto shod znám z 23andMegedmatch nebo Ancestry. Takže pravděpodobně se bude u všech jednat o opravdové v ne příliš dávné minulosti spřízněné bratrance a sestřenice.
    Dalším veledůležitým pozitivem je, že téměř každá shoda má na MyHeritage svůj rodokmen. O tom se nám na Ancestry, natož jinde, nemůže ani zdát. Zbývá si jen přát, kéž bychom měli více shod.

      Proč máme tak málo shod? MyHeritage totiž používá proces tzv. imputace. V této metodě na základě výsledků z genotypovacího čipu (kupy písmenek - snipů - rozházených všude možně v naší DNA) statisticky odhaduje mnohem větší souvislé části naší DNA. K tomu používáme veřejné databáze uplných sekvencí DNA, jako např. 1000 Genome Project. Z podstaty imputace ale musíme být opatrní. Jinak budeme shody vyhlašovat na základě imputací vyrobených shodných sekvencí, bez reálného základu v naměřených hodnotách. Tak jak se dělo v původním MyHeritage beta systému.
      DNA.land používá stejný přístup a také tam mám pouze jednu shodu pro sebe, a má babička se 3mi shodami na MyHeritage tam má shody 2.

      Jaký je tedy závěr? Nová verze hledání genetických shod funguje mnohem lépe, ale tolik užitečná není. Potřebovali bychom více shod! Rozhodně se ale jedná o krok správných směrem. Pokud ještě náhodou na MyHeritage svá data nemáte, není nač váhat. Velmi příjemně vás překvapí kolik shod bude mít k dispozici rodokmen.

    MyHeritage DNA matching now works!


      Big news! MyHeritage DNA matching now works. They consider themselves out of beta, but that may be a little premature. Why?

      Well they went from loose to pretty conservative. Now, you can be fairly confident with all of your matches, but do not expect a lot of them.


    Let me show you how many matches (that I have not uploaded myself) me and family have:
    Myself:  1 single match (with no associated tree)
    My parents: 5, 1 
    My 3 tested grandparents: 3, 0, 3
    My wife: 5

    The good news is I know some of these matches from 23andMe, gedmatch or Ancestry. So they all seem to be the real deal.
    Another positive thing is the highest % of trees among my matches from any service I have used so far! If only there were more matches.

      So why is there just a handful of matches? Imputation is a method where based on a handful of letters (SNPs) in your genotyped result, much larger portion of your genome is statistically reconstructed - using database of full sequenced genomes (like the 1000 Genome Project). The nature of imputation calls for conservative approach, else you will confirm people based on identical imputed sequences, without any ground in actual genotyped data.
      DNA.land uses the same approach and I also have but a single match there, and my grandmother with 3 on MyHeritage has 2.

      The verdict? This is much better, but useful only a little bit. We need more matches! Still I encourage anyone serious in genealogy and genetic genealogy to upload, there is no thing like fishing in too many ponds. And the amount of matches with trees is unprecedented for me.