Encode-Decode

  • 홈
  • 태그
  • 방명록

언어공학 1

Porter Stemmer 구현 - VC_count 알고리즘

6/30 언어공학 수업 Martin F.Porter가 1980년 착안한 stemming 알고리즘 python으로 구현해보기 Stemming = 영어단어에서 접사(affix)를 제거하고 핵심적인 의미를 가지는 어간(stem)을 추출하는 과정 Porter의 algorithm for suffix stripping 에 나오는 단어의 consonant와 vowel의 연속개수를 counting 하고 단계적으로 규칙을 적용하여 stem을 추출하는 아이디어를 코드로 구현해보자 def VC_count (stem): vowel = ['a','e','i','o','u'] consonant = ['b','c','d','f','g','h','j','k','l','m','n','p','q', 'r','s','t','v','w',..

카테고리 없음 2022.07.02
이전
1
다음
더보기
프로필사진

Encode-Decode

따뜻한 기계

  • 분류 전체보기 (31)

Tag

크기가 작은 부분 문자열, 코딩테스트, 구현, nlp, LLM as AGENT, 알고리즘, 데이터분석리그, 프로그래머스, Table Representation Learning, TaBERT, 이코테, 챔피언부문, 신고당한사람, 달리기경주, 2022 빅콘테스트, 추억점수, 수상후기, FullyConnectedLayer, Table-to-Text-Generation, Datascience Pipeline,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

  • Git

티스토리툴바