연구동향정보
제목 연구동향 분석 : 아토바스타틴의 새로운 약물 적응증 탐색을 위한 텍스트 마이닝 분석
글쓴이 관리자
첨부파일

연구동향 분석 : 아토바스타틴의 새로운 약물 적응증 탐색을 위한 텍스트 마이닝 분석

 

배경 : 매년 많은 의학연구가 출판되고 있는 요즘, 보건의료인들은 진료에 도움이 되는 새로운 정보를 얻기 위한 능력을 요구받고 있으며, 체계적 문헌고찰이나 메타 분석 등과 같이 연구결과들을 체계적으로 정리하여 결론 내는 방법들도 개발되었다. 또한 임상문헌으로부터 원하는 지식을 추출하는 방법에서도 데이터 마이닝(data mining) 기법 등 이 고려되었다.

 

본 연구에서는 심뇌혈관 질환의 주요 위험인자인 고지혈증 치료제인 하이드록시 메틸글루타릴 조효소A (Hydroxy-methylglutaryl Coenzyme A, HMG-CoA)환원효소 억제제들 중 아토바스타

틴(Atorvastatin; Lipitorⓡ, Pfizer, Inc., New York, USA)의 의학논문정보를 이용하였는데 HMG-CoA 환원효소 억제제 제품 중 아토바스타틴이 국내를 비롯하여 전 세계적으로 많이 처방되고 있으며 2008년에는당뇨병 발생의 부작용이 보고된 이후 장기간 사용에 대해 논란 중이기 때문이다.

 

연구자료 : 미국 국립보건원의 PubMed를 이용하여 Medline 데이터베이스에 있는 아토바스타틴 관련 연구논문 5,057편 추출. 본 연구는 5,057편의 아토바스타틴 연구초록을 이용하여 넷마이너 4.0 (Netminer, Cyram Inc., Seoul, Korea) 프로그램을 이용하여 분석 함

 

연구초록들의 일반적 특성 및 텍스트 마이닝 결과 : 총 5,057개의 아토바스타틴 연구 논문 초록들은 1990년 출판을 시 작으로 2005년부터 2015년까지 매년 300편 이상이 발표되었으며 2018 년에는 217편이 보고되었다. 초록들에서 추출된 273개의 질병 키워드들 중 총 2,008번 출현한 당뇨병(Diabetes mellitus)을 포함하여 출현 빈도 상위 10위인 질병 키워드들로는 심혈관 질환(Cardiovascular disease), 관상동맥질환(Coronary artery disease), 급성 관상동맥 증후 군(Acute coronary syndrome), 고콜레스테롤혈증(Hypercholesterolemia), 뇌졸중(Stroke), 심근경색증(Myocardial infarction), 이상지질혈 증(Dyslipidemia), 죽상경화증(Atherosclerosis), 고혈압(Hypertension)이었다.

 

Year

1990

1995

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

n

1

4

9

20

41

47

99

129

158

238

255

334

%

0.02

0.08

0.18

0.40

0.81

0.93

1.96

2.55

3.12

4.70

5.04

6.60

Year

2006

2007

2008

2009

2010

2011

2012

2013

2014

2015

2016

2017

n

317

303

359

313

338

347

317

300

323

304

284

217

%

6.27

5.99

7.10

6.20

6.68

6.86

6.27

5.93

6.39

6.01

5.62

4.29

 

출현빈도 상위 50위인 키워드들로 구성된 네트워크 분석 결과 : 273개의 키워드들 중 출현빈도 상위 50위인 키워드들로 구성된 네트워크 분석 결과 밀도는 0.09 (범위 0-1)이었다 중심성 분석에서는 한 키워드가 다른 키워드들과 연결된 정도를 의미하는 연결정도 중심성 값의 평균은 0.096±0.097 (범위 0-0.347)이었으며, 중심성 척도(centrality index)는 26.2%이었다. 연결정도가 높은 상 위 10위의 키워드들은 당뇨병, 심혈관 질환, 이상지질혈증, 죽상경화증, 고혈압, 관상동맥질환, 심근경색증, 심장사건 후 주요부작용(major ad\-verse cardiac events), 급성 관상동맥 증후군, 대사증후군(Metabolic syndrome)이었다.

이들 중 TF-IDF 정도값(degree)의 상위 10위인 키워드들은 심방 세동(Atrial fibrilla\-tion), 심부전(Heart failure), 유방암(Breast cancer), 류마티스 관절염, 복 합 고지혈증, 부정맥(Arrhythmias), 다발성 경화증(Multiple sclerosis), 비알콜성 지방간염, 조영제 유발 신손상, 전립선암(Prostate cancer)이었 다다른 키워드들과 가까운 거리 여부를 확인하는 근접 중심성 값의 평균은 0.231±0.146 (범위 0-0.439)이었고 중심성 척도 는 24.7%이었다. 근접 중심성 값이 높은 상위 10개의 질병 키워드들은 당뇨병, 이상지질혈증, 심혈관 질환, 관상동맥질환, 죽상경화증, 고혈압, 고콜레스테롤혈증, 심근경색증, 심장사건 후 주요부작용, 고지혈증 순 이었다.

 

No

Keywords by

degreecentrality

Score

Keywords by

dosenesscentrality

Score

1

Diabetes mellitus

0.346

Diabetes mellitus

0.438

2

CVD

0.306

Dyslipidemia

0.423

3

Dyslipidemia

0.286

CVD

0.423

4

Atherosclerosis

0.285

CAD

0.416

5

Hypertension

0.265

Atherosclerosis

0.409

6

CAD

0.265

Hypertension

0.403

7

Myocardial infarction

0.225

Hypercholesterolemia

0.384

8

MACE

0.224

Myocardial infarction

0.373

9

ACS

0.204

MACE

0.357

10

Metabolic syndrome

0.183

Hyperlipidemia

0.352

No

Keywords by

betweenscentrality

Score

Keyword by TF-IDF

Score

1

Atherosclerosis

0.109

Atrial fibrillation

42

2

CAD

0.103

Heart failure

38

3

Dyslipidemia

0.095

Breast cancer

37

4

Diabetes mellitus

0.067

Rheumatoid arthritis

37

5

CVD

0.062

Combined hyperlipidemia

36

6

Depression

0.056

Arrhythmias

35

7

Hypertension

0.050

Multiple sclerosis

31

8

Hypertriglyceridemia

0.030

NAFLD

30

9

CKD

0.028

Contrastnnduced AKI

27

10

Alzheimer Disease

0.028

Prostate cancer

27

 

하위구조 파악을 위한 커뮤니티 분석에서는 모듈성 최적 절단점은 0.333점이었으며 이를 적용하여 네트워크를 하위구조로 분류 시 총 17개의 하위그룹으로 분류되었다. 이들 중 2개 이상의 키워드들이 포함된 하위그룹은 총 5개이었다(Figure 1). 가장 큰 그룹은  13개의 키워드 로 구성된 그룹 17로 아토바스타틴의 주요 적응증인 이상지질혈증, 고 콜레스테롤혈증, 고지혈증, 고중성지방혈증, 복합 고지혈증(Combined hyperlipidemia), 가족성 복합 고지혈증(Familial combined hyperlipid\-emia), 대사증후군, 자가면역근염(Autoimmune myositis), 신증후군(Nephrotic syndrome), 비알콜성 지방간염(Non-alcoholic fatty liver dis\-ease), 비만(Obesity), 췌장염(Pancreatitis) 및 류마티스관절염(Rheuma\-toid arthritis)으로 구성되었다.


 

출처 : 정휘수, 강길원, 최웅 et al., 아토바스타틴의 새로운 약물 적응증 탐색을 위한 비정형 데이터 분석 (2018).J Health Info Stat 2018;43(4):329-335


2019-02-11 오후 1:05:01, 조회수 : 245