전현민 (Hyunmin Jeon)
July 11, 1995
대한민국, 서울특별시
Skill
- Python
- Pytorch
- Deep Learning
- NLP
- Task-oriented Dialogue System
Education
POSTECH / M.S.
2019.09 ~ 2021.08
- Computer Science & Engineering
- Overall Grade 3.93 / 4.3
- Advisor: Gary Geunbae Lee
Hanyang University ERICA / B.S.
2014.03 ~ 2019.08
- Computer Science & Engineering
- Overall Grade 4.27 / 4.5
Experience
넷마블 / NLP Engineer
2023.12 ~ Current
Python, Pytorch, NLP
- NLP 연구 & 개발
컴투스플랫폼 / AI developer
2021.09 ~ 2023.11
Python, Pytorch, NLP
- 그룹사 HR 챗봇 개발
- 모바일 게임 FAQ 챗봇 개발
- A/B 테스트를 통한 모델 분석
- 모델 학습 및 평가 자동화를 위한 웹 서비스 개발
- 게임 커뮤니티 NER 모델 개발
- ChatGPT를 활용한 검색 챗봇 개발
와이즈넛 / Intern
2019.01 ~ 2019.02
Python, Scikit-learn, ML, Node.js
- 산학 협력 캡스톤 디자인으로 머신러닝을 활용한 웹 크롤러 개발
Research
Paper
Schema Encoding for Transferable Dialogue State Tracking
- COLING 2022 [ACL Anthology]
DORA: Towards Policy Optimization for Task-oriented Dialogue System with Efficient Context
- Computer Speech & Language [Elsevier]
Domain State Tracking for a Simplified Dialogue System
- arXiv preprint [arXiv]
Simplified Task-Oriented Dialogue System using Domain State
- Workshop on AAAI 2021 (DSTC-9) [Google Drive]
도메인 상태를 이용한 다중 도메인 대화 상태 추적
- 제 32회 한글 및 한국어 정보처리 학술대회 (HCLT 2020) [Google Drive]
수기 답안지 자동 채점 시스템
- 한국정보과학회 학술발표논문집 2019 (KCC 2019) [DBpia]
Patent
대화 로봇을 활용한 법률문서 자동작성 서버 및 그것의 동작방법
- 출원번호: 10-2021-0009714
Project
9th Dialog System Technology Challenge (DSTC-9)
Python, Pytorch, DST, Task-oriented Dialogue System
- 대화 시스템 챌린지인 DSTC-9에 참여 [DSTC-9 Workshop on AAAI 2021]
-
Microsoft가 주최한 Multi-domain Task-oriented Dialog Challenge II 트랙에 참여
- Multi-domain task-oriented dialogue system 개발 및 포스터 세션 발표 [포스터]
법률 챗봇
Python, Pytorch, DST
- 국가 R&D 과제로 고소장 문서 자동 작성을 위한 법률 챗봇 개발
- GPT-2 기반의 belief tracker와 규칙 기반의 NLG를 결합
- SKT AI의 KoGPT-2를 법률 판례 데이터와 법률 상담 대화 데이터로 2차 pre-training 하여 LM으로 사용 [KoGPT-2] [법률 판례 데이터] [LM]
- 기업과 협업한 과제인 관계로 법률 상담 대화와 소스 코드는 비공개
프로토타입 데모 영상
키워드 분석 시스템
Python, Flask, MySQL, Javascript, jQuery, AnyChart, GCP
- GCP를 활용하여 간단한 웹 서비스 구현
- Cloud Run, Cloud Functions, Cloud SQL, Cloud Scheduler
- 크롤링
- 스케쥴링을 통해 뉴스 기사 크롤링
- 크롤링한 데이터를 MySQL DB에 저장
- 뉴스 기사
- 기간별 키워드 추출
- 일간 / 주간 급상승 키워드 추출
- 두 키워드 비교
- 주식
- Yahoo financial API 활용
- 연관 키워드 추출
- 주가 패턴이 유사한 주식 추출
- 서비스 페이지 [URL]
논문 작성 보조 시스템
Python, Flask, Javascript, jQuery, GCP, ChatGPT
- GCP를 활용하여 간단한 웹 서비스 구현
- Cloud Run
- ChatGPT를 활용하여 영문 논문 작성에 도움이 되는 기능 구현
- 단어 번역
- 문장 번역
- 작문
- 문장 변환
- 문법 교정
- 서비스 페이지 [URL]
뉴스 챗봇
Python, Flask, Javascript, jQuery, GCP, ChatGPT
- GCP를 활용하여 간단한 웹 서비스 구현
- Cloud Run
- ChatGPT를 활용하여 경제 뉴스 챗봇 구현
- 경제 뉴스 수집
- 뉴스 문서를 검색하여 문서 기반으로 답변 생성
- 서비스 페이지 [URL]
Toy NLP projects
DS-DST belief tracker 논문 구현
- Find or Classify? Dual Strategy for Slot-Value Predictions on Multi-Domain Dialog State Tracking (Zhang et al., 2019) [논문]
- Pytorch 구현 [Github]
KoGPT-2 summarization 모델
- SKT AI의 KoGPT-2와 신문 기사 요약 데이터를 사용하여 summarization 모델 구현 [신문 기사 요약 데이터]
- Pytorch 구현 [Github]
Machine translation 모델
- Transformer와 ISWLT 2016 EN-DE 데이터를 사용하여 영어 \(\rightarrow\) 독일어 translation 모델 구현 [ISWLT 2016 데이터]
- Attention is all you need (Vaswani et al., 2017) 논문 transformer 구현 [논문]
- Pytorch 구현 [Github]
Sentiment analysis 모델
- Bidirectional LSTM과 Naver sentiment movie corpus (NSMC) 데이터를 사용하여 sentiment analysis 모델 구현 [NSMC 데이터]
- Tensorflow 구현 [Github]
- 2019 오픈인프라 개발 경진대회에서 Youtube 댓글 분석 모델 구현
- Bidirectional LSTM과 NSMC & Sentiment 140 데이터를 사용하여 sentiment analysis 모델 구현 [Sentiment 140 데이터]
- Docker와 Tensorflow serving을 사용하여 모델 배포
- Tensorflow 구현 [Github]
Etc
Worker model
- Machine learning 대학원 수업 final project로 croudsourcing을 위한 worker model을 구현
- Belief propagation & Expectation maximization 알고리즘 사용
- Python 구현 [Github]
Machine learning 웹 크롤러
- 캡스톤 디자인으로 machine learning을 사용한 웹 크롤러 개발
- Scikit-learn의 SVM을 사용
- Puppeteer 라이브러리 사용
- Python & Node.js 구현 [Github]
지하철 빈 자리 체크 시스템
- Global-PBL (in SIT, Japan) 프로그램 과제로 가상의 지하철의 빈 좌석 수를 체크하는 시스템 개발
- YOLO 알고리즘 사용
- Raspberry Pi와 Android 연동
- Python & Android 구현 [Github]
모바일 리듬 게임
- Unity3D를 사용하여 모바일 리듬 게임 어플리케이션 개발
- Unity3D & C# 구현 [Github]
리듬 게임 영상
웹 게시판
- Raspberry Pi에 Raspbian OS를 설치하여 웹 서버로 사용
- APM & JS를 사용해 간단한 웹 게시판 기능 구현 [Github]
Record
9th Dialog System Technology Challenge (DSTC-9) / 2020.10.23
Naver AI Hackathon 2019, speech recognition / 2019.10.27
2019 오픈인프라 개발 경진대회 / 2019.08.30
Certification
Global-PBL program in Shibaura Institute of Technology, Japan / 2019.07.29
Deep learning course from deeplearning.ai, Coursera / 2019.06.24
정보처리기사 / 2019.05.23