전체 글 (73) 썸네일형 리스트형 [Python]추출한 멜론 노래 가사로 워드클라우드 만들기 with 캐글 https://all4null.tistory.com/25 [Python]멜론 노래 가사 추출하기(4)_수집한 데이터 가공하기 with 캐글 저번 시간에는 노래 하나의 가사만 추출하는 작업에 관해 다루었다. 이번 시간에는 노래 하나에 대해서만 수행했던 작업들을 차트의 모든 곡들에 대해 수행하고 이러한 데이터들을 가공하기 쉬 all4null.tistory.com 저번시간. 위 글에서 셀레니움을 이용한 크롤링을 통해 멜론 노래 가사들을 추출해 냈었다. 이번 시간에는 우리는 추출한 노래 가사들을 가지고 워드클라우드를 만들어 어떤 단어가 많이 쓰였는지 확인해볼 예정이다. 워드클라우드란? 데이터에서 얻어진 요소들의 중요도나 인기도 등을 고려하여 시각적으로 늘어놓은 형태를 의미한다. 파이썬에선 어떻게 사용? 파이썬에.. [Python]멜론 노래 가사 추출하기(4)_수집한 데이터 가공하기 with 캐글 저번 시간에는 노래 하나의 가사만 추출하는 작업에 관해 다루었다. 이번 시간에는 노래 하나에 대해서만 수행했던 작업들을 차트의 모든 곡들에 대해 수행하고 이러한 데이터들을 가공하기 쉬운 꼴로 만들어줄 예정이다. 0. find_element와 find_elements의 차이점 시작하기 전에 find_element와 find_elements의 차이점에 대해 짚고 가도록 하겠다. find_element와 find_elements의 차이점은 요소를 찾을 때 조건에 해당하는 요소가 여러 개인 경우, 혹은 조건에 해당하는 요소가 하나도 없는 경우 동작 방식에 있다. find_element의 특징 먼저, find_element는 조건에 해당하는 요소가 여러 개일 경우, 웹문서의 제일 위에 있는 요소 하나만 반환하며,.. [Python]멜론 노래 가사 추출하기(3)_셀레니움으로 노래가사 찾기 with 캐글 저번 시간에는 셀레니움이 어떻게 동작하는지에 관해 알아보았다. 이번 시간에는 저번시간의 내용들을 바탕으로 실제로 노래가사를 추출하는 작업을 해보도록 하겠다. 먼저 셀레니움은 사람이 직접 웹사이트에 들어가 동작하는 것과 비슷하게 동작한다고 보면된다. 우리가 멜론사이트에서 멜론차트에 있는 곡들의 가사를 보려면 멜론사이트접속->멜론차트->곡정보->가사보기 의 과정을 통해서 가사를 직접 봐야한다. 우리는 이 작업들을 셀레니움으로 구현해보려고 한다. 1.접속할 웹드라이버 만들기 웹드라이버를 만드는 작업은 다음 글에 자세하게 설명되어있으니 참고바란다. https://all4null.tistory.com/22 [Python]멜론 노래 가사 추출하기(1)_크롤링준비하기 with 캐글 대부분의 스트리밍사이트에서는 노래가.. [Python]멜론 노래 가사 추출하기(2)_셀레니움은 어떻게 요소들을 찾는가? with 캐글 저번 시간에는 크롤링에 관련된 용어 정리와 개발환경 세팅을 하였다. 이번 시간에는 저번 시간에 만든 크롤러가 어떻게 작업을 수행하는지 과정을 살펴볼 예정이다. 먼저 기본적으로 셀레니움은 사람이 웹페이지를 들어가 상호작용하는 것처럼 동작된다. 사람은 웹페이지 상에 구현된 버튼을 보고 클릭을 하지만 셀레니움은 어떻게 버튼을 찾고 구분을 할까? 셀레니움은 다음과 같은 Locater들을 사용해서 요소를 찾는다. 로케이터 설명 class name Class name이 같은 요소를 찾는다(복합 클래스 이름은 허용되지 않는다) css selector CSS selector이 일치하는 요소를 찾는다. id ID 속성이 일치하는 요소를 찾는다. name Name 속성이 일치하는 요소를 찾는다. link text 보이는 .. [Python]멜론 노래 가사 추출하기(1)_크롤링준비하기 with 캐글 대부분의 스트리밍사이트에서는 노래가사가 복사가 되지 않는 문제가 있다. 노래가사들을 가지고 어떤 내용의 가사가 많은지 분석하고 싶어서 방법을 이리저리 찾아보던와중 크롤링이라는 좋은 기법을 알게 되었고 이를 응용해보기로 하였다. 먼저, 시작하기에 앞서 관련 개념들에 대해 먼저 정리해보도록 하겠다. 크롤링이란? 크롤링(crawling)이란 웹페이지를 읽어와 웹페이지의 내용을 추출해내는 행위이다. 일일이 사람이 웹페이지로부터 데이터를 수집하기 어려울 때 이용하는 기술이라고 보면 될 듯하다. 크롤링을 시작하기전에 먼저 크롤링을 하기위한 환경을 한번 세팅해보겠다. 개인의 노트북이 아닌 캐글이라는 곳에서 다룰 예정이다. (개인 노트북으로 실행 할려면 어떻게 해야하는 지는 조만간 다루도록 하겠다) 캐글이란? 데이터분.. [자료구조][C언어]그래프란?(4)_DFS와 BFS_좀 더 알아보기 저번시간에는 DFS와 BFS의 개념에 관해 배웠었다. 이번시간에는 DFS와 BFS 예제를 몇가지 더 살펴볼 예정이다. 저번시간 복습을 해보자. DFS와 BFS는 무엇인가? DFS(Depth First Search)는 깊이 우선 탐색이다. 아래 자료와 같이 한방향으로 갈 수 있을 때 까지 깊게 들어간 다음 가장 가까운 갈림길로 돌아와 다시 깊게 들어가는 탐색 방식이다. 스택을 활용해서 구현이 가능하다. BFS(Breath First Search)는 너비 탐색 우선이다. 아래 자료와 같이 한 정점에서 가장 가까운 정점들을 방문하고 나중에 떨어진 정점들을 방문하는 탐색 방식이다. 큐를 사용해서 구현이 가능하다. DFS 예제 DFS를 인접리스트 방식으로 나타낸 그래프에서 작동하는 방식을 알아보자. 아래와 같은 .. [자료구조][C언어]그래프란?(3)_DFS와 BFS의 이해 저번시간에는 그래프 자료구조를 C언어로 구현하는 작업을 해보았다. 이번시간에는 DFS와 BFS에 대해서 알아볼 예정이다. DFS와 BFS는 무엇인가? DFS(Depth First Search)는 깊이 우선 탐색이다. 아래 자료와 같이 한방향으로 갈 수 있을 때 까지 깊게 들어간 다음 가장 가까운 갈림길로 돌아와(백트래킹) 다시 깊게 들어가는 탐색 방식이다(재귀적으로 동작한다). 돌아오기 위해서는 스택이 필요하다. 스택을 활용해서 구현이 가능하다. 그림으로 간단하게 표현하자면 아래와 같이 나타낼 수 있다. BFS(Breath First Search)는 너비 우선 탐색이다. 아래 자료와 같이 한 정점에서 가장 가까운 정점들을 방문하고 나중에 떨어진 정점들을 방문하는 탐색 방식이다. 큐를 사용해서 구현이 가능.. [Tensorflow][Keras]인공지능? 머신러닝? 딥러닝? 요즈음 인공지능이 일상생활 속에도 많이 쓰이면서 쉽게 들을 수 있게 되었습니다. 그래서 인공지능 딥러닝 머신러닝 데이터 분석.. 등등 많은 관련 용어들이 혼용되어 쓰이는데 이에 대해 개념을 올바르게 잡아보도록 해보겠습니다. 인공지능, 머신러닝, 딥러닝? ● 인공지능 인공지능이란 인간의 학습능력, 추론 능력, 지각 능력 등을 인공적으로 구현하려는 컴퓨터과학의 세부 분야 중 하나입니다. ● 머신러닝 인공지능 중에서도 방대한 데이터를 바탕으로 모델을 만들고 학습해서 예측을 하는 분야를 머신러닝이라고 합니다. ● 딥러닝 머신러닝 중에서도 다층 신경망을 사용하는 경우는 딥러닝이라고 합니다. 즉, 인공지능>머신러닝>딥러닝 의 포함관계에 있음을 파악할 수 있습니다. 머신러닝의 종류 인공지능 다음으로 범위가 큰 머신러.. 이전 1 ··· 4 5 6 7 8 9 10 다음