Welcome to UOS Data Mining Lab.

Research Area

Data / Text Mining

Data mining is a process of discovering patterns in large data sets involving methods at the intersection of machine learning, statistics, and database systems.

Machine Learning

Machine learning (ML) is the study of computer algorithms that improve automatically through experience. It is seen as a subset of artificial intelligence.

Big Data Analysis

Big data is a field that treats ways to analyze, systematically extract information from, or otherwise deal with data sets that are too large or complex to be dealt with by traditional data-processing application software.

Project

timeline

  • 2020.04.~2022.12

    데이터 품질 평가기반 데이터 고도화 및 데이터셋 보정 기술 개발

    Development of data improvement and dataset correction technology based on data quality assessment

  • 2018.11-2021.10

    시멘틱 텍스트 큐보이드 기반 자가증식 기술 및 딥러닝 학습 기술

    Data Augmentation and Deep Learning Technology based upon Semantic Text Cuboid Model

  • 2016.11~2017.10

    머신러닝 기반 상황인지형 외식 컨텐츠 서비스 개발 플랫폼 구축

    Context-aware Food Contents Service Development Platform based on Machine Learning

  • image alt text

    2015.11~2018.10

    자동 진화형 고성능 다차원 문서 분류시스템의 개발

    Development of Evolutionary High-Performance Multi-Dimensional Text Classification System

  • image alt text

    2015.07~2020.08

    머신러닝 기반 화재피해예측 서비스 개발

    Development of Fire Damage Prediction based on Machine Learning

  • image alt text

    2013.06~2016.05

    시멘틱 텍스트 큐보이드 기반 대용량 텍스트마이닝 프레임워크의 연구

    Large-scale Text Mining Framework based on Semantic Text Cuboid

  • image alt text

    2015.09~2016.08

    빅데이터를 활용한 스마트 관광 서비스 모델 연구

    Research on Smart Tourism Service Model using Big Data

Publication

Journal-International

Extended Autoencoder for Novelty Detection with Reconstruction along Projection Pathway

APPLIED SCIENCE-BASEL, 2020.07

Dependence Representation Learning with Convolutional Neural Networks and 2D Histograms

APPLIED SCIENCE-BASEL, 2020.02

Fraud detection for job placement using hierarchical clusters-based deep neural networks

Applied Intelligence, 2019.08

Towards perfect text classification with Wikipedia-based semantic Naive Bayes learning

NEUROCOMPUTING, 2018.11

Multidimensional text warehousing for automated text classification

Journal of Information Technology Research, 2018.04

About relationship between business text patterns and financial performance in corporate data

Journal of Open Innovation: Technology, Market, and Complexity, 2018. 02

Wikipedia-based Concept Networks: A Probabilistic Approach

INFORMATION-An International Interdisciplinary Journal, 2017.10

Machine learning-based topical web crawler: An ensemble approach incorporating meta-features

Journal of Engineering and Applied Sciences, 2017.09

Social Text Warehousing with Topic Graphs for Fire Damage Analysis

Advanced Science Letters, 2016.11

DDMQ: A Publish/Subscribe Protocol for Internet of Things and WWW

Advanced Science Letters, 2016.11

Patent-Enhancing Strategies by Industry in Korea Using a Data Envelopment Analysis

Sustainability, 2016.09

Building Semantic Concept Networks by Wikipedia-Based Formal Concept Analysis

Advanced Science Letters, 2015.03

Cluster-based Hierarchical Topic Trees for Topic Detection

Life Science Journal, 2014.07

Evaluation on the Effect of Retweet in Twitter Ranking

INFORMATION-An International Interdisciplinary Journal, 2013.11

Journal-Domestic

LSTM-GAN 기반 이상탐지 모델을 활용한 시계열 데이터의 동적 보정기법

한국인터넷방송통신학회, 2023.04

오토인코더 기반 수치형 학습데이터의 자동 증강 기법

한국인터넷방송통신학회, 2022.10

데이터 융합을 위한 관계형 테이블 임베딩 기법

한국전자거래학회지, 2022.08

공간 정보를 가지는 데이터셋의 준자동 융합 기법

한국전자거래학회지, 2021.11

혼합형 데이터 보간을 위한 디노이징 셀프 어텐션 네트워크

한국콘텐츠학회논문지, 2021.11

인접성 벡터를 이용한 트리플 지식 그래프의 임베딩 모델 개선

한국전자거래학회, 2021.08

다중 스태킹을 가진 새로운 앙상블 학습 기법

한국전자거래학회, 2020.08

적대적 오토인코더 기반 화재 위험 건물 검출 기법

데이터베이스연구, 2019.12

시맨틱 텐서공간모델 기반 텍스트데이터 증식기법

데이터베이스연구, 2019.12

머신러닝 기반 자동 데이터 시각화를 위한 특징공학

한국통신학회논문지, 2019.09

T-EBOW를 이용한 취업알선 챗봇용 단문 분류 연구

인터넷정보학회논문지, 2019.04

감성분석을 위한 문맥 기반 임베딩을 이용한 온라인 딥러닝 기법

데이터베이스연구, 2019.04

자동문서분류를 위한 텐서공간모델 기반 심층 신경망

데이터베이스연구, 2018.12

Wasserstein 거리를 이용한 연속형 변수 이산화 기법

데이터베이스연구, 2018.12

DNN 기반 감독형 매니폴드 학습과 계층 군집 분석을 통한 화재 예측 기법

정보과학회 논문지, 2018.08

화재 예측을 위한 퍼셉트론 기반 가중 유클리디안 거리함수의 최적화

데이터베이스연구, 2018.04

삼분 그래프 기반 외식 추천 기법

데이터베이스연구, 2018.04

LSI를 이용한 차원 축소 클러스터 기반 키워드 연관망 자동 구축 기법

정보과학회 논문지, 2017.11

스마트관광을 위한 통합관광플랫폼에 관한 연구

Journal of Tourism and Industry Research, 2017.08

소셜 텍스트의 주요 정보 추출을 위한 로지스틱 회귀 앙상블 기법

정보처리과학회 논문지 2017.05

클러스터 기반 키워드 연관망의 자동 구축

데이터베이스연구, 2017.04

주제 기반 뉴스 기사 수집을 위한 메타 속성 융합형 기계학습 아키텍처

데이터베이스연구, 2017.04

텐서공간모델 기반 시멘틱 검색 기법

한국전자거래학회지, 2016.11

위키피디아 링크를 이용한랭크 기반 개념 계층구조의 자동 구축

한국전자거래학회지, 2015.11

위키피디아 기반의 3차원 텍스트 표현모델을 이용한 개념망 구축 기법

정보과학회 논문지, 2015.09

위키피디아의 백링크 정보를 이용한 개념 계층 트리의 자동 구축 기법

데이터베이스연구, 2015.04

위키피디어 기반 개념 공간을 가지는 시멘틱 텍스트 모델

한국전자거래학회지, 2014.08

Conference-International

Multivariate Time Series Data Correction by combining Attention-based LSTM and GAN Model

9th IEEE International Conference on Applied System Innovation 2023 (IEEE ICASI 2023), 2023.04

BAMT-GAN: Balanced Augmentation of for Mixed-type Tabular Data

9th IEEE International Conference on Applied System Innovation 2023 (IEEE ICASI 2023), 2023.04

Deep Learning Models with Stratification-based Loss Function on Domain Knowledge-based Time series Data: Hypotension Prediction

2022 IEEE International Conference on Big Data (Big Data), 2022.12

An AutoEncoder-based Numerical Training Data Augmentation Technique

2022 IEEE International Conference on Big Data (Big Data), 2022.12

Autoencoder-based One-class Classification Technique for Event Prediction

4th International Conference on Cloud Computing and Internet of Things, 2019.09

Machine Learning-based Automated Data Visualization: A Meta-feature Engineering

IEEE International Conference on Applied System Innovation, 2019.04

GAN-based One-CLASS Classification FOR Personalized Image Retrieval

2018 IEEE International Conference on Big Data and Smart Computing, 2018.01

Developing Text Warehousing for Rapid Text Analytics

2016 11th International Workshops on Information Technology and Computer Science, 2016.12

Semantic Text Classification with Tensor Space Model-based Naive Bayes

IEEE International Conference on Systems, Man, and Cybernetics 2016, 2016.10

Building Cluster-based Word Networks from Textual Data

3rd International Conference on Big Data Analysis and Data Mining, 2016.09

Multi-dimensional Text Warehousing for Text Analytics

The 2016 International Conference on Information & Knowledge Engineering, 2016.07

Development of Customized Service Model for Smart Tourism using Big Data

World Conference on Business and Management 2016, 2016.06

Automatic Development of Corpus-dependent Concept Graphs using Wikipedia

2016 International Conference on Applied System Innovation (ICASI 2016), 2016.05

Machine Learning-based Topical Web Crawler: An Ensemble Approach Incorporating Meta-features

8th International Conference on Engineering & Technology, Computer, Basic & Applied Sciences (ECBA2016), 2016.05

Social Text Warehousing for Fire Damage Analysis

The 2nd International Conference on Advanced Science and Information Technology (ASCIT2016), 2016.03

DDMQ: A Publish/Subscribe Protocol for World Wide Web and Internet of Things

The 2nd International Conference on Advanced Science and Information Technology(ASCIT2016), 2016.03

A Semantic Search Techniques with Wikipedia-based Text Representation Model

The 3rd International Conferenceon Big Data and Smart Computing (BigComp2016), 2016.01

Mining Unified Term-Concept Networks from Text Tensor Space Model

International Scientific Conference on Engineering and Applied Science (ISCEAS2016), 2015.07

Enhanced Document Clustering using Wikipedia-based Document Representation

International Conference on Applied System Innovation (ICASI2015), 2015.05

Building Concept Graphs using Wikipedia

International Conference on Applied System Innovation (ICASI2015), 2015.05

Semantically Enriching Text Representation Model for Document Clustering

The 30th ACM/SIGAPP Symposium On Applied Computing (SAC2016), 2015.04

Building Semantic Concept Networks by Wikipedia-based Formal Concept Analysis

The 2015 World Congress on Information Technology Applications and Services, 2015.02

Conference-Domestic

LSTM-GAN 기반 시계열 데이터 품질 개선 기법

2021년도 한국통신학회 동계학술발표대회, 2021.11

한국어 텍스트 임베딩 모델의 개선을 위한 예비 연구

2021년도 한국통신학회 하계종합학술발표회, 2021.06

머신러닝 기반 유행어 판별모델을 위한 특징공학

2020년도 한국정보과학회 하계종합학술발표회, 2020.07

텍스트 유사도 분석 기반 상황인지형 추천 프레임워크

2019년도 한국정보과학회 학술발표대회, 2019.12

다중 스태킹을 가진 새로운 앙상블 학습 기법

2019년도 한국인터넷정보학회 추계학술발표대회, 2019.11

시맨틱 텐서공간모델 기반 텍스트데이터 증식기법

2019년도 한국인터넷정보학회 추계학술발표대회, 2019.11

오토인코더를 이용한 단일 클래스 화재위험 건물 탐지 성능의 개선

2019 한국컴퓨터종합학술대회, 2019.06

실시간 스트리밍 텍스트 데이터 분석 시스템 설계

2019 한국통신학회 학술대회, 2019.01

머신러닝 기반 자동 시각화를 위한 메타데이터 특징공학

2019 한국통신학회 학술대회, 2019.01

성공적인 빅데이터 분석 방법론 교육의 고찰

2016 공학교육학술대회, 2016.11

메타 속성을 융합한 기계학습 기반 화재 뉴스 필터링 기법

한국정보처리학회 2016 추계학술대회, 2016.11

기계학습을 활용한 소셜 텍스트의 주요 정보 추출 기법

한국정보처리학회 2016 추계학술대회, 2016.11

클러스터 기반 키워드 랭킹 기법

한국정보처리학회 2016 추계학술대회, 2016.11

화재피해분석을위한 융합형 다차원 데이터웨어하우징 기술

2015년 한국화재소방학회 추계학술대회, 2015.11

데이터 통찰 중심의 빅데이터 교육에 관한 연구

2015년 공학교육학술대회, 2015.09

위키피디아 링크 기반 개념 계층구조의 자동 구축

2014년 한국정보과학회 동계학술대회, 2014.12

위키피디아 기반 3차원 텍스트 표현모델을 이용한 개념망 구축 기법

2014년 한국정보과학회 동계학술대회, 2014.12

위키피디아를 활용한 개념 계층구조의 자동 구축 기법

2014년 한국컴퓨터종합학술대회, 2014.06

텍스트마이닝을 위한 새로운 텍스트 표현모델

한국전자거래학회 2014 춘계학술대회, 2014.05

Patent

관계형 테이블 임베딩 장치 및 방법

10-2022-0120512, 2023.04.26

수치형 변수 및 범주형 변수를 포함하는 혼합형 결측 데이터에 대한 데이터 보간을 수행하는 장치 및 방법

10-2021-0150649, 2022.06.14

수치형 테이블 데이터 증강기

C-2022-051201, 2022.05.12

가중 트리플 지식 그래프를 생성하는 장치, 방법 및 컴퓨터 프로그램

10-2021-0135086, 2022.04.22

시맨틱 텐서공간모델과 어텐션 매커니즘을 활용하여 문서를 분류하는 장치 및 방법

10-2020-0185534, 2022.04.12

관계형 테이블 임베딩 벡터 생성기

C-2022-033111, 2022.03.31

디노이징 셀프 어텐션 네트워크 기반 결측값 보간기

C-2021-038712, 2021.05.12

트리플 데이터에 대한 임베딩 공간 생성기

C-2021-031073, 2021.03.10

그래프 임베딩 기반의 의미적 연관 단어 추출기

C-2021-031072, 2021.03.10

자동분류 개선을 위한 멀티태스킹 모듈

C-2021-010921, 2021.01.09

적대적 오토 인코더 기반 이상 데이터 검출 장치

10-2020-0062385, 2020.11.24

상품 추천 서버 및 상품 추천 방법

10-2017-0166896, 2020.01.03

데이터를 시각화하는 장치 및 방법

10-2019-0051020, 2019.10.25

본문 태그 판별 모델 제공장치, 방법 및 본문 태그 판별 모델 적용 장치

10-2017-0108618, 2019.07.18

문서분류 장치 및 방법

10-1983752-0000, 2019.05.23

문서 분류 시스템 및 그 방법 (SYSTEM AND METHOD FOR text classification)

10-1968309-0000, 2019.04.15

문서를 검색하는 방법(METHOD FOR SEARCHING DOCUMENT)

10-1769940-0000, 2017.08.14

문서 요소에 대한 유사도를 산출하는 방법(METHOD FOR CALCULATING SIMILARITY BETWEEN DOCUMENT ELEMENTS)

10-1623860-0000, 2016.05.18

텍스트 큐보이드 마이너

C-2015-004465, 2015.02.27

위키 개념 계층 트리 관리 시스템

C-2015-004026, 2015.02.23

문서를 매트릭스로 표현하는 방법(METHOD FOR REPRESENTING DOCUMENT AS MATRIX)

10-1494795-0000, 2015.02.12

개념적 텐서공간모델 기반 텍스트 3차원 큐보이드 생성기

C-2014-008291, 2014.04.10

대용량 문서 데이터 스트림을 위한 실시간 클러스터 생성기

C-2014-0002179, 2014.01.23

MEMBERS

Professor

Han-joon Kim

Educations

1994 : BS in Statistics and Computer Science, Seoul National University
1996 : MS in Statistics and Computer Science, Seoul National University
2002 : Ph.D. in Computer Science and Engineering, Seoul National University
2003~: Associate professor, Department of computer Science and Engineering

Interests

- Data Mining(데이터마이닝): 추천 알고리즘
- Text Mining(텍스트마이닝): 자동문서분류, 클러스터링, 계층관계 탐사
- Database Systems, Data Warehousing: 규칙기반 자동 데이터 웨어하우징 


Enrolled Students

Soon-Kwan Kwon

M.S students

Yoon-Seok Choi

M.S students

So-Hyun Yoon

M.S students

Chan-Hoon Park

Undergraduate students


Alumni

Ju-Eun Jeong

-

Han-Seok Jeong

-

Jong-Chan Yun

-

Gill-Jae Lee

-

Su-Eun Lee

-

Sae-Rom Jeo

-

Do-Hoon Lee

-

Seung-Yeop Shin

LINA 생명
Employee

Hee-Won Choi

Bigtech Corp.
Research Engineer

Ji-Yeon Kim

-

Pu-Reum Lim

Prompt Technology
Research Engineer

Sang-Won Ha

Spoon Radio
Employee

Tae-Jun Kim

KAIST Graduate School of Culture Technology
Doctorate

So-Hyeon Kim

-

Han-Muk Yu

Deep Work Corp.
Co-founder

Bang-Rae Lee

KISTI
Senior Researcher

Jeong-Rae Kim

KIST
Post Doctor

Ki-Ju Hong

ESTsoft Corp.
Engineer

Ga-Hee Lee

SK C&C.
Employee

Seung-Yeon Lee

-

Hyeon-Su Kim

-

Man Hyeon

-

Jun-Ho No

LG Electronics Corp.
Engineer

Seong-Jik Lee

Kakao Corp.
Engineer

Hong-Jun Yun

Kakao Corp.
Engineer

Eon-Geun Yun

-

Min-Kyeong Kim

WISEnut Corp.
Mining Consulting Director

Bong Heo

SamSung SDS Corp.
Pro

Hee-Soon Hwang

-

A-Ram Lee

-

Min-Yeong An

-

Jong-Myeong Park

Witcom Corp.
Senior Engineer

Geon-Tae Kim

Twentyfive Corp.
CEO


Lorem ipsum dolor sit amet, consectetur adipisicing elit. Aut eaque, laboriosam veritatis, quos non quis ad perspiciatis, totam corporis ea, alias ut unde. Markdown supported.

Github

Deep Learning based Data Engineering

https://github.com/uos-dmlab

github

Contact Us

Mail khj@uos.ac.kr or call 02-6490-5715