2025.02.28
출처
느긋함, 배워야 하는 삶의 자세.
정신없이 박사생활에 쫒기는 날이노라면, 하루가 어떻게 지나가는지, 한달이 어떻게 흘렀는지도 모를 급이...
2023년의 1월, 끝없는 자기와의 싸움.
박사생활은 끝없는 자기 자신과의 싸움이다. 그중에서도 제일 힘든 싸움은, 내가 과연 잘하고 있는 것인가 ...
[파이썬 Python] 트위터 텍스트 전처리하기 Text Pre-Processing: lemmatization 표제어 추출 + POS (Part-Of-Speech) 품사 태깅
텍스트 전처리를 할때 = 필요없는 문자제거 + stopwords 제거 까지 했다면 + 그 다음은 표제어 추출...
[다국어 텍스트분석 Multilingual Text Analysis] 영어 이외의 stop words 제거하기 - 한국어 불용어 사전 만들기
나의 목표는 2월내로 non-English 텍스트분석도 편하게 하는 것. 따라서 지금 English 텍스트 분석하면서...
[파이썬 Python] 트위터 텍스트 전처리하기 Text Pre-Processing: stopwords (불용어) 제거하기
필요없는 문자들을 제거했다면, 두번쨰로 해야할 것들은 불용어들을 제거해주는 것이다. 이를 위해서는 우...
[파이썬 Python] 트위터 텍스트 전처리하기 Text Pre-Processing: re.sub으로 불필요한 문자들 제거하기.
겨울방학 전에 끝내려고 했던 코딩을 아직도 부여잡고 하는 중이라.. 얼른 끝내기 위해 압박감용으로 블로...
예술가와 학문하는 사람은 한끝차이 아닐까.
좋아하는 아티스트가 앨범을 낼 때면 이따금씩 드는 생각이 있다. '나도 얼른 publish해야지...'...
[파이썬 Python] 경로 지정하는 효율적인 방법
파이썬이나, R이나, STATA나, 파일의 경로를 지정하는 것은 데이터 관리 분석의 핵심이다. R에서는 ...
[파이썬 Python] n-gram으로 Document-Term Matrix (DTM) 만들기.
저번 포스팅에서는 데이터셋에서 DTM을 만드는 파이썬 코딩을 공유했었다. 그러나 그렇게 만든 DTM은...
케이트 보스워스가 말하는, 마흔의 내가 젊은 나에게 말해주고 싶은 것들.
소셜미디어를 후루룩 스크롤링을 하다가, 우연하게 마주한 포스팅. 케이트 보스워스가 마흔을 맞아 젊은 본...