본문 바로가기

▶ 자연과학/▷ 생물정보학

【생물정보학】 모델 생물 라이브러리 모델 생물 라이브러리 추천글 : 【생물정보학】 생물 라이브러리 1. Homo sapiens (human) ⑴ 유전자는 전부 대문자. GRCh38 레퍼런스 기준 36601개 (ENSG) ⑵ human gene annotation (24424 genes) ① Gene ID ② Entrez ID ③ chromosome number, start, end, width ④ strand ⑤ transcript ID (transcript_id) ⑥ bioType ⑦ aliases ⑧ protein ID (p_id) ⑨ 간단 설명 2. Mus musculus (mouse) ⑴ 유전자 첫 글자만 대문자이고 나머지는 소문자. mm10 레퍼런스 기준 32285개 (ENSMUSG) ⑵ 사람과 마우스 유전자의 상동(gene ho..
【생물정보학】 bulk RNA-seq에서 DEG 획득하기 (DESeq2, t test, ANOVA) bult RNA-seq에서 DEG 획득하기 (DESeq2, t test, ANOVA) 추천글 : 【생물정보학】 생물정보학 분석 목차 1. RStudio 함수 [본문] 2. 예제 [본문] a. 전사체 분석 파이프라인 1. RStudio 함수 [목차] ⑴ 2개 집단의 DESeq2 기반 DEG 획득하기 a = 'DSS_ST_late' b = 'DSS_Saline_late' Idents(pbmc_gene)
【생물정보학】 유전자 스코어 라이브러리 유전자 스코어 라이브러리(gene score library) 추천글 : 【생물정보학】 생물정보학 분석 목차  1. 개요 [본문]2. BP [본문]3. CC [본문]4. MF [본문]a. 유전자 라이브러리 b. 셀 타입 마커 유전자 c. 리간드-수용체 상호작용 데이터베이스 1. 개요 [목차]○ 기타 부족한 정보는 수십억 개의 논문을 큐레이션 한 https://typeset.io/, https://www.scinapse.io/를 참고할 수 있음  2. BP(biological process) [목차]○ 섬유화(fibrosis) 마커 : COL1A1, COL3A1, COL5A1, SPP1, FN1, POSTN, FGF1, PDGFB, CTGF, FGF7, IL34, CDC42, CXCL12 (SDF1), TG..
【생물정보학】 유전자 라이브러리 유전자 라이브러리  추천글 : 【생물정보학】 생물정보학 분석 목차 1. 개요 [본문]2. 각 유전자 별 설명 [본문]a. 유전자 스코어 라이브러리  b. 셀 타입 마커 유전자c. 리간드-수용체 상호작용 데이터베이스  1. 개요 [목차]⑴ 유전자를 가리킬 때에는 이탤릭체로 표현하고, 단백질을 가리킬 때에는 정자체로 표현함① 단, 여기에서는 정자체로 통일하기로 함 ⑵ Homo sapiens (human)① 유전자는 전부 대문자. GRCh38 레퍼런스 기준 36601개 (ENSG)  ② human gene annotation (24424 genes)  ○ Gene ID○ Entrez ID○ chromosome number, start, end, width○ strand○ transcript ID (transc..
【생물정보학】 xFuse의 이해 및 실행 xFuse의 이해 및 실행 (ref) 추천글 : 【생물정보학】 생물정보학 분석 목차 1. 개요 [본문] 2. step 1. forward scheme [본문] 3. step 2. inference [본문] 4. step 3. prediction [본문] 5. 프로그램 실행 [본문] 1. 개요 [목차] ⑴ 목적 : 저해상도의 ST 라이브러리를 고해상도의 ST 라이브러리로 만드는 것 ① 전체 스팟의 개수는 Visium 프로토콜 기준으로 최대 4992개에 불과함 : 상당히 저해상도라고 할 수 있음 ⑵ 배경 이론 ① 이산확률이론 ② 연속확률이론 ③ CNN(convoluted neural network) ⑶ 가정 ① I : 가우시안 분포를 따른다고 가정 ② X : 음이항 분포를 따른다고 가정 2. step 1. ..
【생물정보학】 RCTD의 이해 및 실행 RCTD의 이해 및 실행 (ref) 추천글 : 【생물정보학】 생물정보학 분석 목차 1. 개요 [본문] 2. 수학적 이론 [본문] 3. 코드 [본문] 4. 결과 [본문] 5. 결론 [본문] 1. 개요 [목차] ⑴ 기존 spatial transcriptomics의 한계 ① 특정 cell type이 어디에 위치하는지 알기 어려움 ○ 이유 1. spatial transcriptomics spots 위에 single-cell이 놓이지 않고 수십~수백 개의 cell들이 놓일 수 있기 때문 ○ 이유 2. spot 위에 수 개의 cell들만 올라가더라도 별개의 cell로 인식하지 못하고 하나의 새로운 cell로 인식함 ② 기존 unsupervised marker-dependent analysis의 단점 (ref) ○ ..
【생물정보학】 CellPhoneDB Tutorial CellPhoneDB Tutorial 추천글 : 【생물정보학】 리간드-수용체 상호작용 분석 1. 설치 [본문] 2. 레퍼런스 [본문] 1. 설치 [목차] ⑴ 리눅스 환경 준비 혹은 anaconda3 설치 ⑵ 입력 파일 ① cellphonedb_meta.txt ② cellphonedb_count.txt ⑶ 예제 코드 # 1. 가상환경 생성 및 활성화 conda create -n cpdb python=3.7 activate cpdb # 혹은 conda activate cpdb pip install cellphonedb activate cpdb # 혹은 conda activate cpdb # 2. 예시 데이터 설치 curl https://raw.githubusercontent.com/Teichlab/cellp..
【생물정보학】 데이터 분석 : Kaplan-Meier 생존 곡선 데이터 분석 : Kaplan-Meier 생존 곡선 추천글 : 【생물정보학】 생물정보학 분석 목차 1. 이번에 죽은 환자 수 [본문] 2. # of censored [본문] 3. 지금까지 살았을 확률 [본문] 4. R 코드 [본문] 5. 파이썬 코드 [본문] 총 걸린 시간 (t) 이번에 죽은 환자 수 (d) 전까지 살아있던 환자 수 (n) # of censored 이번에 죽었을 확률 (d/n) 이번에 살았을 확률 (1 - d/n) 지금까지 살았을 확률 (L) 6 1 23 0 0.0435 0.9565 0.9565 12 1 22 0 0.0455 0.9545 0.9130 21 1 21 0 0.0476 0.9524 0.8695 27 1 20 0 0.0500 0.9500 0.8260 32 1 19 0 0.0526 ..