범람하는 메일과 포탈 공지사항 속에서 우리에게 필요한 공지사항만을 찾아볼 수 있을까요? 고려대학교 AI 선배가 강의, 전공, 비교과를 추천해주듯 포탈에 있는 공지사항도 학생의 선호에 맞춰 보내줄 수 있다면 교내 구성원의 불편을 최소화하고 정보 전달 효율성을 높일 수 있을 것입니다. 이번 뉴스레터에서는 공지사항 데이터를 살펴보고, Sentence-BERT와 지식 그래프를 활용해 학생 개인에 맞춰 맞춤형으로 공지를 보내줄 수 있는 방안을 탐구해보도록 하겠습니다.


 우선 공지사항에는 어떤 데이터가 있는지, 학생들은 어떤 공지를 많이 보는지 탐색적으로 알아보겠습니다. 이번 뉴스레터에서는 2022년 4월 28일 ~ 2022년 12월 1일까지의 포탈 공지사항 클릭 로그 데이터를 분석합니다. 해당 데이터는 포탈 아이디와 공지사항 클릭 로그로 구성되어 있습니다. 







<그림 1> 일자별 클릭 분포 


 <그림 6>은 일자별 클릭 분포를 보여줍니다개강중간고사 등 중요한 학사 일정을 반영한 학부생 클릭 데이터 분포를 알기 위해 12월 1일까지의 클릭 데이터를 확인해 보았습니다. 2022년 10월 31(6,983), 2022년 10월 11(6,773), 2022년 9월 5(3,223), 2022년 8월 16(2,999등의 일자에서 높은 클릭 회수가 확인되었습니다. 


공지사항 (상위권 공지 중 선별)


1. 2022-2학기 학생처특별장학금 신청 안내


2. 2022학년도 학부 학사일정 수정(수강희망과목 등록고연전 등안내


3. 2022학년도 2학기 KU Pride Club 생활비 장학금 신청 안내 

4. 2022학년도 1학기 코로나19장학금(생활비신청 안내



5. [학부] 2022-2학기 수강신청 일정 안내




6. 2022-2학기 교내장학금(고대가족장학금,KU드림장학금,소망장학금,재해극복장학금)신청 안내

7. 2022학년도 제2학기 이중전공 전형 합격자 안내





 해당 공지사항의 제목을 Sentence-BERT를 사용해 임베딩 한 뒤 클러스터링을 진행했습니다. 공지사항 제목은 불필요한 단어가 적은 편이며 의미도 명확하게 구분되는 단어들로 이루어진 단문으로 구성되어 있습니다. 따라서 문장 단위 클러스터링에 매우 적합합니다. 다음은 해당 제목을 영역별로 나눈 결과입니다.




영역 


제목 예시



0


공모전

[사회공헌원] '000'와 000 공모전


1


교내 사업 및 프로젝트


[0000센터] 2022-1학기 0000센터 00사업 담당자(전문가모집공고(2)



2


교내 및 국가장학금


[교내-10/31] 2022학년도 2학기 000장학금 2차 신청 안내



3


국제/한국어 관련


국제어학원 외국어센터 교육조교 모집


4


연구 발표회


제 4회 KU 자유정의진리 프레젠테이션 대회 개최 수상작 공유


5


기타 사업 및 대회


0000산업 테마연구 참가자 모집


6


학사 공지


2023학년도 학부 학사일정 안내


7


채용 공지


0000원 직원모집


8


교원 관련 소식


00대학 000 교원 관련 소식


9


근로 장학생


[데이터Hub팀] 근로장학생 모집


10


외부재단 장학


00 장학재단 장학생 선발 안내


11


교내 인프라 공지


보행자안전 환경개선 공사


12


대학원


[일반대학원] 2023학년도 전기 일반대학원 석박사통합과정


13


기타 교내 일반 공지


[총무부] 00 모집 안내


14


학생 활동


[한국어센터] 학부생 홍보대사 모집




 학생들은 어떤 영역을 주로 클릭했을까요?





<그림 2> 영역별 클릭 분포 





<그림 3> 학년별 영역 클릭 분포

 영역 클릭 확인 결과 대부분 교내 및 국가 장학금외부재단/장학학사 공지를 클릭하는 것이 확인되었습니다. 대다수를 차지하는 세 영역을 제외하고나면 학생 활동, 근로 장학생 영역을 많이 클릭하는 것으로 보입니다. 학년별 분포도 이와 비슷합니다. 


 다음 편에서는 지식 그래프와 클릭 로그 데이터에 기반한 공지사항 추천 시스템 구축 방법을 자세히 알아보도록 하겠습니다.