일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- Surgical video analysis
- nibabel
- non-parametric model
- 확산강조영상
- 모수적 모델
- 데코레이터
- deep learning #segmentation #sementic #pytorch #UNETR #transformer #UNET #3D #3D medical image
- genetic epidemiology
- parer review
- 코드오류
- 파이썬
- MICCAI
- 유전역학
- TabNet
- tabular
- precision #정밀도 #민감도 #sensitivity #특이도 #specifisity #F1 score #dice score #confusion matrix #recall #PR-AUC #ROC-AUC #PR curve #ROC curve #NPV #PPV
- Phase recognition
- decorater
- TeCNO
- parametric model
- paper review
- parrec
- words encoding
- 확산텐서영상
- monai
- PYTHON
- nlp
- 비모수적 모델
- nfiti
- MRI
- Today
- Total
KimbgAI
[medical] 유전역학-개론 2주차, 기초유전학 본문
지난 수업은 유전체 역학 연구의 개요에 대한 내용이었고,
이번 수업은 기초유전학에 대한 내용이다.
지난 시간에 다뤘던 내용처럼,
Traits은 Phenotype + Genotype으로 결정된다.
유전학 연구의 history를 보면, 1990~2003년 사이에 폭발적인 연구 성장이 이루어졌음을 알 수 있다.
이는 genome project 연구가 완성된 2003년과 맥락을 같이한다.
사람의 몸은 약 50조개의 세포가 있다고 한다.
모든 세포는 genome 카피본을 2개씩 가지고 있고, 각각 세포는 그들이 보유한 유전자 중 오직 몇개의 것에 의해 그 형태와 활동이 달라진다.
위 그림을 보면, 세포 안에는 미토콘드리아, 핵 등이 있고, 핵 안에는 염색체(chromosomes)이 있다.
(염색체가 왜 염색체냐하면, 정확히 기억은 안나는데 옛날에 염색체를 연구를 위해 염색체에 염색을 해서 그렇다나.. chrome이 염료라는 뜻이다.)
염색체는 실타레처럼 얽혀있는데, 그것을 풀어보면, scaffold protein이라는 실같은 것에 fiber 형태로 얽혀있고,
더 깊이 파보면 밧줄에 동전을 꿰어놓은 것처럼, 염색질(chromatin)에 Histone(8개가 한 묶음)이 꿰어져있다.
histone에 얽힌 chromatin을 풀면 DNA형태와 같은 것이 나오는 걸 볼 수 있다. (되게 복잡하네)
위 그림은 chromosome의 anatomy이다.
chromosome은 23개가 있다.
흔히 헷갈리는 부분이 있는데, 왼쪽 그림은 1번 염색체에 대해서 엄마것 하나, 아빠것 하나로 구성된 그림이다.
이 왼쪽 그림이 1번 염색체에 대한 완전한 세트라고 할 수 있는데,
1번 염색체에 대해 엄마것 한세트, 아빠것 한세트해서 2n으로 존재하는 그림이다.
세포 핵에는 이 형태로 23세트 존재한다는 것이다.
이 그림처럼 homologous(상동) pair는 명칭이 있는데,
같은 성별의 염색체(즉, 엄마것으로부터 나온것)끼리는 sister chromatids라고 하고, 다른 성별끼리의 염색체는 nonsister chromatids라고 한다.
염색체 중앙은 centromere라고 하며, centromere 위쪽은 p-arm, 아래쪽은 q-arm이라고 한다.
이 그림은 한 염색체의 위치를 대략적으로 알수있게 해준다.
예를 들면, '7q31.2'라는 어떤 코드같은 이름은 CFTR 유전자의 주소를 의미한다.
CFTR 유전자는 '7번 염색체의 q-arm의 3번째 영역의 첫번째 밴드의 2번째 서브밴드에 있다' 이런식이다.
위 그림을 보면 Nucleotide strand에 Nitrogenous base가 붙어 있다.
Nucleotide strand에 phosphate group이 붙어있고, 그 다음에 sugar가 붙는다.
그 위에 Nitrogenous base에 어떤 것이 붙느냐에 따라 ATGC가 결정된다.
Nitrogenous base는 흔히 ATGC라고 하는 염기서열 구성이며, 각각의 짝이 있는데 C는 G와, T는 A와 결합한다.
그 말은 한쪽의 strand에 붙어있는 염기서열을 알면 그 짝궁 서열을 알 수 있다는 이야기다.
그럼 그 '한쪽'의 기준을 어떻게 정의할까?
DNA가 합성되는 방향으로 기준을 삼는데, DNA는 5프라임에서 3프라임 방향으로 합성을 한다.
한편, 헷갈리는 용어를 정리하고 발현 순서를 보면,
Genome은 한 유기체의 완전한 DNA set를 의미하며, 이는 30억개의 pairs가 있다.
Gene은 DNA에서 실제로 protein을 만드는데 역할을 하는 unit을 의미하며, genome에 21,000개 정도 있다고 한다.
Promoter는 유전자 발현에 영향을 주는 역할을 하며, Exon은 mRNA에 의해 전사(transcription)된다.
DNA에서 발현되는 mRNA는 DNA의 한개의 strand가 나오며, 기본적으로 염기서열 명칭은 똑같지만, T가 U로 바뀐다는 특징이 있다. 이 mRNA로 특정 function을 하는 protein이 만들어진다. mRNA 중 3개씩 묶여서 하나의 아미노산이 만들어짐.
DNA는 어떻게 추출하는가??
혈액을 뽑아 원심분리기를 통해 층을 구분하고, Buffy coat라는 부분에 백혈구가 있는데 그것을 스포이트 같은 걸로 뽑는다. 그 후 어떤 후처리를 통해 순수한 DNA를 추출한다.
영화에서 보면 머리카락 같은 걸 통해서도 DNA를 추출하기도 하지만 왜 혈액에서 뽑는가? 가장 쉽고 저렴하기 때문! ㅎㅎ
앞서 언급한 것처럼, genome (30억개의 염기서열) 중 실제 protein을 만드는데에 역할을 하는 염기서열은 1.5%정도이다.
protein을 만들지 않는 다른 성분들도 어떤 역할을 하는걸로 밝혀지고 있다고 한다.
(무엇인지 나는 모름)
위 그림을 이해하는 것이 상당히 중요한데, 먼저 용어를 보자면,
Allele[얼릴]은 주어진 유전적 위치(locus)(A 또는 T)에 있는 DNA 세그먼트의 대체 형태이다. 즉, Homologous chromosome에서 같은 유전적 위치에 있는 상대편의 DNA 이다. (위 그림에서 빨간색(paternal)과 파란색(maternal))
Locus[로커스](복수는 loci[로싸이])는 염색체에서 유전자의 위치를 말한다.
Genotype은 어떤 locus에서의 allele의 pair를 말한다.
Haplotype은 어떤 생명체에서 한 부모로부터 함께 유전되는 대립유전자의 집합, 즉 한 염색체의 한쪽 allele.
SNP[스닙]은 단기염기다형성(single nucleotide polymorphism)으로 평균 300개의 염기서열에서 하나 꼴로 일어나는 염기변이를 말한다.
heterozygote[헤트로자이곳]은 특정 유전자에서 서로 다른 allele을 가지고 있는 경우를 말하며,
homozygote은 같은 allele을 가지고 있는 경우를 말한다.
(zygote(접합자)은 소의 뿔이 두개로 갈라지는 형태을 의미하는 단어에서부터 왔다고 한다.)
한편,
한 개의 유전자(gene)는 평균 1만(10K) 개의 염기(base)로 구성되고, 이 중 300분의 1에 해당하는 평균 300여 개의 SNP가 존재한다. 대부분 인트론(intron)에 위치하는 이 SNP는 임상적인 의미보다는 생물학적 다양성을 나타낸다. 그러나 이 중에서 수 개에서 수십 개의 SNP는 인간의 형질, 특히 건강에 유의한 영향을 미치는 것으로 알려져 있는데, 이 SNP를 발견해내는 것이 유전체의학의 핵심이다
(출처: https://m.medigatenews.com/news/3811934036)
Genetic variants는 DNA 서열의 변화를 의미한다.
pair-level에서 나의 genome은 99.9%가 다른 사람과 동일하지만, 0.1%가 다르다. 이는 나를 unique하게 만드는 형질을 만든다.
이런 변이는 사이즈에 따라 다르게 불리는데, SNV(single-nucleotide variant), INDEL(small insertion/deletion), SV(structural variant) 순이다.
변이를 부를 용어는 다양하다. Mutation, Polymotphism, Variant 등..
이들은 중립적인 단어이며 우열을 나타내지 않는다. 최근에는 variant라는 단어를 많이 쓰고 있다.
SNP는 genome에서 가장 흔하게 나타나는 형태이다.
단백질 형성에 영향을 미치는지에 따라 mutation의 종류가 나뉜다.
Silent는 단백질 생성에는 영향을 미치지 않고,
Nonsense는 단백질 형성이 안되는 것을 의미하고,
Missense - consevative는 기존과 다른 것이 생성되지만 그마나 비슷한 것.
Missense - non-consevative는 기존과 다른 것이 생성되는데 아예 다른 것이 생성됨을 의미한다.
SV는 genomic rearragement가 1000Kb 이상 일어나는 것을 의미하는데, 삭제, 삽입, 도치 등 다양한 형태가 나타난다.
변이의 원인은 다양하다.
일반적으로 상속받은 것이 가장 크고, 상속은 잘 되었지만 복제단계에서 오류가 나거나, 바이러스나 방사선과 같은 돌연변이 유발요인(mutagen)에 의한 것이 있다.
Germline mutation은 태어날때부터 타고난 변이이다. 대표적으로 유전질환이 있다.
Somatic 은 후천적으로 만들어지는 변이이다. 유전암을 제외하고 암은 특정 세포나 조직에 somatic mutation으로 발생한다.
Mitosis(체세포분열)는 더 많은 세포를 만들기 위해 분할하는 것이다.(운동하면 근육질이 되는 것 처럼?)
이는 다음 세대로 전달되지 않는다.
Meiosis(감수분열)은 유성 생식을 하는 생물들이 정자나 난자 같은 생식자(gamete)를 생성하기 위해 종자세포(germ cell)에서 수행하는 특별한 세포 분열 방법이다. (수정; fertilization)
Meiosis에 과정에서 세포의 상태가 Diploid와 Haploid로 달라진다.
Diploid(이배체)는 두 쌍의 유전자(2n)가 있고, Haploid(반수체)는 하나의 유전자(n)이 존재한다.
이 과정에서 genetic recombination이 발생하는데, 좌측 그림의 맨 오른쪽 chromosome처럼 맨 처음과 다르게 paternal, maternal에서의 유전자가 서로 교차된다.
이는 감수분열에 의해 새로 생성된 생식세포(gamete)는 서로 동일하지 않음을 의미한다.
이 때문에 모든 개인들은 서로 다르다.
한국에서는 일본의 영향을 받아, dominant와 recessive를 각각 우성과 열성으로 번역을 했는데,
이는 특정 유전자 형질의 우월성을 의미하는 것이 절대 아니다.
하지만 의미적으로 뜻이 변질될 우려가 있어, 원어 그대로 익히는 것이 좋다고 하셨다.
■ dominant allele + dominant allele = dominant phenotype
■ dominant allele + recessive allele = dominant phenotype
■ recessive allele + recessive allele = recessive phenotype
다인자 유전(Polygenic inheritance)는 유전자 상호작용이 없는 여러 유전자들이 하나의 형질에 상가효과(additive effect)로 관여하는 현상을 의미한다. 위 그래프를 보면 대문자 알파벳이 들어가 있으면 점점 검게 보이는 것과 비슷하다.
Genetic heterogeneity(유전성 이질성)는 서로 다른 유전자를 가지고 있지만 비슷한 phenotype을 보이는 것이다.
(멘델에서는 하나의 유전자가 하나의 phenotype과 연관이 있다고 믿었음)
그 중 Locus heterogeneity (위 그림에서 우측 첫번째 fig.A)는 서로 다른 유전자들로 인해 같은 phenotype이 보이는것.
Allelic heterogeneity(fig.B)는 하나의 유전자 내에서 특정 locus가 달라 같은 phenotype을 보이는 것이다.
Pleiotropy(다면 발현)은 한개의 유전자 내 같은 위치임에도 다른 phenotype을 보이는 것.
Penetrance(침투)라는 개념은 질환과 gene 사이의 관계의 정도를 나타내는 것이다.
예를 들면, 어떤 질병 A가 같은 gene를 보유한 100명 중 30명에서 나타난다면 penetrance가 30%라는 것이다.
Expressivity는 gene과 질병 사이에 penetrant한 관계가 있지만, 질환이 나타나는 정도를 나타낸다.
이는 아래 그림을 보면 명확하게 알 수 있다.
끝!
'medical' 카테고리의 다른 글
[medical] 유전역학-개론 5주차, 유전체 시퀀싱 기술 (1) | 2023.04.05 |
---|---|
[medical] 유전역학-개론 4주차, 전장유전체 연관분석(GWAS) (2) | 2023.03.28 |
[medical] 유전역학-개론 3주차, 연구설계방법 (0) | 2023.03.22 |
[medical] 유전역학-개론 1주차, 유전역학 개요 (0) | 2023.03.14 |
[medical] 확산강조영상(Diffusion weighted image, DWI), 확산텐서영상(Diffusion tensor image, DTI) 란? (0) | 2023.02.06 |