2025.02.28
출처
예술가와 학문하는 사람은 한끝차이 아닐까.
좋아하는 아티스트가 앨범을 낼 때면 이따금씩 드는 생각이 있다. '나도 얼른 publish해야지...'...
[파이썬 Python] 경로 지정하는 효율적인 방법
파이썬이나, R이나, STATA나, 파일의 경로를 지정하는 것은 데이터 관리 분석의 핵심이다. R에서는 ...
[파이썬 Python] n-gram으로 Document-Term Matrix (DTM) 만들기.
저번 포스팅에서는 데이터셋에서 DTM을 만드는 파이썬 코딩을 공유했었다. 그러나 그렇게 만든 DTM은...
케이트 보스워스가 말하는, 마흔의 내가 젊은 나에게 말해주고 싶은 것들.
소셜미디어를 후루룩 스크롤링을 하다가, 우연하게 마주한 포스팅. 케이트 보스워스가 마흔을 맞아 젊은 본...
[파이썬 Python] 트윗 텍스트 전처리하기 (Text Pre-processing)
텍스트 전처리 방법은 다양하다. 전처리는 다소 통과 의례처럼 여겨지지만, 사실은 매 작업마다 "이것...
[파이썬Python] 여러개 json 파일 합치기 + Pandas로 데이터 프레임 만들기
일전에 json을 열고 pandas 데이터 프레임으로 만드는 포스팅을 올렸었다. 그러나 json이 여러개가 있다면?...
미국 항공사, 이게 최선인가요.
한국인들로서 외국 생활 중 가장 적응하기 어려운 몇가지중 하나는, 공항의 품격이다. 인천공항의 규모, 서...
내가 사랑하는 도시, 미국의 수도 워싱턴 디씨의 연말은 어떨까.
어느덧 9년전이다. 이 도시에 살았던 시간이. 태어나서 처음으로 한국을 떠나 낯선 곳에서 '살아본&#x...
[텍스트 분석 Text Analysis] 텍스트 전처리 (Text Preprocessing)은 무엇이고, 이걸 왜 해야하는 걸까? (차원의 저주와 차원 축소)
텍스트 분석을 할 때 가장 빠질 수 없는 작업은 "텍스트 전처리 (text preprocessing)"이다. 말...
[텍스트분석 text analysis] BoW와 Word2Vec 차이점 (Bag of Words vs. Word2Vec)
Bag of Words <딥러닝을 이용한 자연어 처리 입문>에 따르면, BoW를 만드는 방법은 두가지다. 1)...