우수참여인력 인터뷰 정보의 홍수 속에서 가치와 핵심을 찾아내다 정보학 분야 중 텍스트 마이닝 연구 연세대학교 빅데이터 기반 미래형 지식 정보서비스 사업팀 허고은 박사

스마트폰, SNS가 익숙해지고 IoT 기술이 발달하면서 데이터의 규모가 급증하고 있습니다. 이를 ‘빅데이터’라고 하는데요. 산업, 정치, 과학 등 사회 전 분야에 이용되는 만큼 ‘4차 산업혁명은 빅데이터 혁명’이라는 말까지 나오고 있습니다. 하지만 정보가 많아질수록 ‘신뢰성’에 대한 문제가 대두되고 있는 가운데, 해결책 중 하나로 떠오른 ‘텍스트 마이닝’ 기술. 정보의 홍수 속에서 가치와 핵심을 찾아내는 연세대학교 빅데이터 기반 미래형 지식 정보서비스 사업팀 허고은 박사를 만나보았습니다.

BK21플러스사업 참여우수인력 허고은 박사 연세대학교
빅데이터 기반 미래형 지식 정보서비스 사업팀
Ch.01 나의 연구 이야기
“의료진과 신약 개발자에게 양질의 사전지식을 제공한다면,
결과적으로 우리 삶의 질을 높일 수 있는 연구가 될 것입니다.”
1. 안녕하세요. 본인 소개를 부탁드립니다.

안녕하세요. 연세대학교 문헌정보학과 빅데이터 기반 미래형 지식 정보서비스 사업팀의 연구교수로 재직 중인 허고은입니다. 저는 현재 정보학 분야 중에서도 텍스트 마이닝 연구를 주로 수행하고 있습니다.

2. 텍스트 마이닝은 빅데이터 기술의 숨은 조력자라 불리기도 하는데요. 교수님의 주 연구 주제는 어떤 분야에서 활용되고 있나요?

저는 생의학 학술 문헌을 대상으로, 문헌 내에서 기존에 알려지지 않은 새로운 가설을 발견하는 연구를 주로 수행하고 있습니다. 석사과정 때 지도교수님을 통해 알게 된 저명한 학자 한분이 있는데요. Don R. Swanson의 문헌 기반 발견(LBD)의 ABC 모델에 관심을 가진 것이 그 시작점이었던 것 같아요. 실제 박사학위 논문 역시 문헌 내 불확실성을 의미하는 단어를 발견해 ABC 모델에서 개체들 간의 관계성을 불확실성 단어로 연결지어 가설 발견의 가능성을 높이는 연구로 진행했습니다. 현재 제가 수행 중인 가설 발견 기법은 크게 폐쇄형 발견(Closed Discovery, CD) 개발형 발견(Open Discovery, OD)으로 나뉘는데요. CD 기법으로는 RD(레이노병)-FO(어유)의 관계와 마그네슘 결핍-마이그레인의 관계를 연결짓는 중간 개체들을 새롭게 발견하는 연구, OD 기법으로는 기존에 알려져 있는 관계성과 연결되는 새로운 개체의 가능성을 찾는 연구를 수행하고 있습니다.

3. 가장 힘들었거나 뿌듯했던 순간, 기억나시나요?

연구자라면 다들 같은 생각일테지만, 역시 박사학위 논문을 빼놓을 수가 없죠.(웃음) 저는 당시 한 학기 안에 최소 3번의 논문 심사를 수행했는데요. 첫 번째 논문 심사를 받기 위해 결론을 제외한 모든 연구 결과를 도출해야 했습니다. 그리고 심사위원의 의견에 맞춰 실험을 수정하고 추가해 결과 도출을 새롭게 해야 하는 경우도 있었죠. 시간이 촉박한 상황에서 모든 수정사항을 반영하기 위해 하루에 두세시간 자면서 연구했던 기억이 아직도 생생합니다. 돌이켜보면, 가진 체력도 모두 소진해 정말 정신력 하나로 버텼던 것 같아요. 그래서 박사학위를 받았을 때가 가장 뿌듯한 순간이지 않았나 싶습니다. 지금까지 걸어온 길을 돌아보며 연구자로서 긴 여정의 첫 단계를 잘 마무리했다는 생각도 들었고요. 무엇보다 평소 존경해온 학과 교수님들로부터 박사로서의 자격을 인정 받았다는 게 감격스러웠어요.

4. 그럼 만약 이번 연구가 실용화돼 대중에게 선보인다면 어떤 기대효과가 있을까요?

텍스트 마이닝 연구는 생각보다 우리 일상과 많이 밀접해있습니다. 신약 개발에 들어가는 시간과 비용을 효율적으로 줄일 수 있거든요. 의학 영역에서 중요한 의사결정을 내리는 데 텍스트 마이닝 연구 결과가 양질의 사전지식으로서 역할을 수행할 수 있기 때문입니다. 예를 들어 특정 약물과 단백질, 유전자의 관계를 확립하거나 증상과 질병 간의 관계를 확인하는 데 유용하게 쓰이죠. 특히 의료 SNS 데이터를 수집해 현대사회의 주요 질병인 우울증, 불면증 등을 여러 요인과 함께 체계적으로 분석해 의료진과 신약 개발자에게 사전지식을 제공할수 있습니다. 이는 한국뿐 아니라 세계적인 질병 문제의 원인을 파악하는 데 기여해 결과적으로 우리 삶의 질을 높일 수 있는 연구가 된답니다.

5. 추후 연구 계획도 궁금합니다. 연구자로써의 최종 목표가 무엇인가요?

우리 삶의 질을 높이는 연구를 하고 싶어요. 의학 분야와 관련된 연구를 꾸준히 해온 것도 이 이유 중 하나입니다. 텍스트 마이닝 기반으로 각종 질병 문제를 해결할 수 있기를 바라고 있거든요. 그러기 위해선, 먼저 박사학위 논문과 연결지어 연구의 불확실성이 시간의 흐름에 따라 어떻게 변화해왔는지 파악하고, 이를 기반으로 과거와 현재 관계를 분석해 미래를 정확히 예측할 수 있는 연구를 수행하고자 합니다. 특히 딥러닝과 같은 최신 기술을 효율적으로 활용해 예측 가능성을 높여가고자 합니다.

Ch.02 내게 BK21 플러스는
“우수참여인력 선정은 저에게 ‘지금까지 정말 잘 해왔고,
앞으로도 잘 할거야’라는 든든한 응원의 메시지가 되었습니다.”
1. BK21플러스가 연구수행에 어떤 도움이 되었나요?

아무래도 석박사 과정 학생들이 연구를 수행하는 데 있어 정말 다양한 차원의 지원을 받을 수 있었습니다. 특히 국내에서 학위과정을 밟고 있는 입장에서, 국제 컨퍼런스 참여를 통해 더 큰 시야를 선사해주는 부분이 가장 큰 도움이 됐어요. 세계적인 연구자들 앞에서 연구 내용을 발표하고 또 깊이 소통할 수 있는 기회가 아무래도 가장 좋은 지원사항이 아니었나 싶습니다.

2. 그럼 혹시 BK21플러스에 건의하고 싶은 점이 있나요?

국제 학술대회에서 이렇게 많은 것을 배우고 온 것만큼, 그 기회가 앞으로 더 확대가 된다면 좋을 것 같아요. 국제 학술대회뿐 아니라 더 나아가 단기·장기 연수 기회도 많아진다면 더 없이 좋겠죠? 또 한가지 개인적인 바람은 사업과 관련된 행정 업무가 보다 간소화돼 학위과정생이나 신진연구인력이 연구에만 집중할 수 있는 환경이 만들어졌으면 해요. 아니면 행정, 예산에 대한 요청 업무를 지원해주는 제도가 새로 마련되는 것도 하나의 방법이라고 생각합니다.

3. 우수한 연구성과를 인정받아 이번에 BK21플러스 우수참여인력으로 선정되신 소감도 안들어볼 수 없겠죠?

생각지도 못했는데 제 인생에서 정말 감사한 표창을 받았습니다. 학위 과정동안 기쁘고 감사한 순간도 많았지만 힘들고 지친 순간들도 있었고 가끔은 ‘내가 과연 잘 하고 있는가’ 의구심이 들기도 했거든요. 그럴 때 이 상은 ‘지금까지 정말 잘 해왔고, 앞으로도 잘 할 거야’라는 강한 응원의 메시지가 되었습니다. 더 열심히 정진해야겠다는 동기부여가 됐고요. 앞으로 힘든 순간이 또 닥칠 때, 이 상을 생각하며 마음을 다 잡을 수 있을 것 같습니다.

  • ▲ 지도 교수님과 함께
  • ▲ 제5회 BK21플러스 우수 연구인력 시상식(2019년)
Ch.03 한 명의 연구자로서
“넘쳐나는 텍스트 데이터 속에서 유의미한 지식을 발견해
좋은 영향력을 주는 진정성 있는 학자가 되고 싶습니다.”
1. 연구에서 가장 중요하게 생각하는 것은 무엇인가요?

호기심, 목표, 끈기라고 생각합니다. 일단 연구를 시작하기 위해선 학문적 호기심이 있어야 하거든요. 그리고 이를 본격적으로 구체화하고자 한다면 연구 목표를 설정해야 합니다. 원하는 방향을 정하는 아주 중요한 단계죠. 그 다음엔 끈기를 가지고 연구에 임해야 합니다. 처음에는 열정적으로 시작했지만 수행 과정 중에 생각지 못한 문제에 부딪히면 초심을 잃게될 가능성이 많거든요. 그래서 끈기와 집념이 있어야 최종적으로 연구를 완성해낼 수 있다고 생각합니다.

2. 연구를 진행하며 가장 고마웠던 멘토가 있다면 이야기해주세요.

저의 롤모델인 송민 교수님께 진심으로 감사드리고 싶습니다. 교수님을 처음 만나뵌 2012년이 아직도 생생한데요. 현재 이 자리까지 올 수 있도록 저를 성장시켜주신 분입니다. 제가 나무만 보면서 틀 안에 갇혀 있을 때 숲을 보는 연구자가 될 수 있도록 이끌어주셨고, 언제나 진심어린 조언과 격려를 아끼지 않으셨거든요. 특히 늘 연구에 몰두하느라 바쁜 와중에도 학생들 한명 한명 지도하고 관심 가져주시는 모습을 보며, 학문적인 측면뿐 아니라 삶의 태도와 성품까지 닮고 싶다는 생각을 많이 하고 있습니다. 또 다른 학과 교수님들과 저와 같은 길을 함께 걷고 있는 우리 TSMM 연구실 선후배 여러분에게 이 자리를 빌어 감사인사를 드리고 싶습니다.

3. 마지막으로, 앞으로 10년 후 연구자로서의 나는 어떤 모습일지, 어떤 삶을 살고 있을지 상상해보신 적 있나요?

제가 진심으로 존경하는 지도교수님처럼 늘 연구에 정신하면서 후학을 양성하는 진실된 교수가 되고 싶습니다. 특히 4차 산업혁명 시대, 정보의 홍수 속에서 유의미한 지식을 발견해 내는 텍스트 마이닝 연구를 꾸준히 수행해 앞으로 사회에 좋은 영향력을 줄 수 있는 진정성 있는 학자로 기억되는 것이 꿈입니다.

NRF한국연구재단
  • 대전청사 : (34113) 대전광역시 유성구 가정로 201 | TEL 042-869-6114 | FAX 042-869-6777

    서울청사 : (06792) 서울특별시 서초구 헌릉로 25 | TEL 02-3460-5500