Encode-Decode

  • 홈
  • 태그
  • 방명록

Porter Stemmer 1

Porter Stemmer 구현 - VC_count 알고리즘

6/30 언어공학 수업 Martin F.Porter가 1980년 착안한 stemming 알고리즘 python으로 구현해보기 Stemming = 영어단어에서 접사(affix)를 제거하고 핵심적인 의미를 가지는 어간(stem)을 추출하는 과정 Porter의 algorithm for suffix stripping 에 나오는 단어의 consonant와 vowel의 연속개수를 counting 하고 단계적으로 규칙을 적용하여 stem을 추출하는 아이디어를 코드로 구현해보자 def VC_count (stem): vowel = ['a','e','i','o','u'] consonant = ['b','c','d','f','g','h','j','k','l','m','n','p','q', 'r','s','t','v','w',..

카테고리 없음 2022.07.02
이전
1
다음
더보기
프로필사진

Encode-Decode

따뜻한 기계

  • 분류 전체보기 (31)

Tag

크기가 작은 부분 문자열, 알고리즘, 프로그래머스, Datascience Pipeline, LLM as AGENT, FullyConnectedLayer, 이코테, 추억점수, 달리기경주, Table Representation Learning, Table-to-Text-Generation, 신고당한사람, TaBERT, nlp, 코딩테스트, 구현, 데이터분석리그, 2022 빅콘테스트, 수상후기, 챔피언부문,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/08   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

  • Git

티스토리툴바