Skip to content

[큐시즘 25기 기업프로젝트] 개인화된 뉴스 추천 서비스, 뉴스마루

Notifications You must be signed in to change notification settings

hyeseungS/Kusitms_42maru4

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

📰 개인화된 뉴스 추천 서비스, 뉴스마루

📌 프로젝트 기간 : 2022년 3월 5일 ~ 2022년 3월 18일

📌 Team : 42MARU X 호두마루 (4조)

  • API 개발, 화면 구성, 서버 구축, DB 구축 및 관리 : 신혜승, 한지혜

  • 뉴스 키워드 추출 : 조선희, 최혜영

  • 워드 클라우드를 통한 뉴스 키워드 시각화 : 최민경

📌 Description

현대사회는 엄청난 정보의 홍수속에서 개인이 원하는 정보를 찾기 위해서 많은 시간이 필요합니다. 42MARU는 질의의도를 의미적으로 이해하고 방대한 비정형 데이터에서 ‘단 하나의 정답’만을 제공하는 QA(Question Answering) 및 TA(Text Analytics) 플랫폼을 통해 이러한 이슈를 해결하고 있습니다.

이에 따라, 42MARU X 호두마루기계독해/요약모델 및 TextRank/공공 인공지능 오픈 API를 활용하여 뉴스 키워드 추출과 함께 개인화된 뉴스 추천 서비스를 제공하고자 합니다.

📌 Development Environment & Language

📌 URL

www.newsmaru.tk

📌 Feature

  • 로그인/회원가입

로그인뉴스마루-상세보기3

  • 뉴스 등록

뉴스등록

  • 뉴스 보기
    • 해시태그 검색
    • 카테고리별 필터
    • 뉴스 정렬

뉴스보기

  • 뉴스 상세보기
    • 요약 모델
    • 키워드 추출(해시태그)
    • 워드 클라우드
    • 스크랩
    • 성별/연령별 스크랩 통계

상세보기상세보기2

  • MY 뉴스
    • 회원별 조회/스크랩 목록 조회
    • 회원별 추천 뉴스(성별에 따라)
    • 조회 목록 삭제

MY뉴스MY뉴스2

📌 Usage

요약모델과 키워드 추출을 통해 사용자가 방대한 뉴스 내용을 정리하여 보다 쉽게 이해할 수 있으며, 워드 클라우드를 통한 뉴스 키워드 시각화를 통해 사용자가 뉴스를 한눈에 볼 수 있습니다. 또한, 키워드 검색, 카테고리 필터, 정렬, 조회/스크랩 및 통계, 회원별 추천 목록 등 다양한 기능을 통해 개인화된 뉴스를 접할 수 있습니다.

📌 Detail

키워드 추출


공공 인공지능 오픈 API는 에트리에서 제공한 형태소 분석, 개체명 인식 등등 다양한 API를 사용해서, 명사/동사/개체명을 빈도수 위주로 추출해줍니다. 저희는 이 중에서, 명사와 개체명의 결과를 토대로 기사에서 일상단어를 제외하여 중요한 의미를 가지는 한 단어 키워드 추출을 진행했습니다.

TextRank 알고리즘을 사용하여, 형태소 분석과 각 단어의 연관성을 가중치를 통해 추출된 단어들을 사용해, 두 단어를 합쳐서 나오는 키워드와 한 단어의 키워드를 조합해서 기사에 연관도 높은 키워드를 추출하였습니다. TextRank를 사용한 알고리즘은 python을 사용했으며, flask로 서버를 배포하여 spring에서 api를 호출하여 키워드 추출을 진행합니다.

두 방법을 사용해 키워드를 추출하여 더욱 다양하고 정확도 있는 키워드 추출을 진행하였습니다.


시각화

✨ R

  • 사용한 라이브러리
    • KoNLP, WordCloud, WordCloud2, Remotes, Multilinguer
    • Trouble Shooting: To install KoNLP Package in Rstudio 4.1.3 -> Download "multilinguer" and "remotes" library

✨ Python

  • 사용한 라이브러리
    • Matplotlib, Konlpy.tag, Twitter, WordCloud, PIL, Numpy

📌 Reference

공공 인공지능 오픈 API : https://aiopen.etri.re.kr/guide_wiseNLU.php

TEXTRANK 참고:https://bab2min.tistory.com/570

About

[큐시즘 25기 기업프로젝트] 개인화된 뉴스 추천 서비스, 뉴스마루

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published