본문 바로가기

전체 글

(16)
[Pandas] 데이터프레임 행 선택 조건 쓸일이 생각보다 많은데 자주 까먹는것 같아서 포스팅. 데이터프레임에서 특정 조건을 지정하여 행을 선택하고싶은경우, 예를들어 df['text']에서 길이가 20이상인 경우의 행들만 선택하고 싶은경우엔 이렇게 하자 df[df['text'].map(len) > 20]
[Python] zip! zip 함수 알아두면 유용하게 쓸일이 많다. 여기 동일한 길이를 가진 2개의 리스트가 있다. list_a = [1,2,3,4,5] list_b = ['사과','배','김치','바나나','키위'] list_a와 list_b에서 값을 하나씩 꺼내어 새로운 list에 저장해보자 result_list = list(zip(list_a,list_b)) result_list의 값으로 => [(1,'사과'), (2,'배'), (3,'김치'), (4,'바나나'), (5,'키위')] 가 얻어진다. 각 리스트에서 값을 하나씩 꺼내와 튜플로 짝지어 리스트 형태로 반환한다. 주로 딕셔너리를 만들때 유용하다 result_dict = {} for a,b in zip(list_a,list_b): result_dict[a] = b 이..
[github] github에 100mb 이상 파일 push github에 100mb 이상 파일 올리는 방법을 공유한다. github에서 git-lfs라는 오픈소스를 공개했는데 사용법이 간단한다. git-lfs 설치 후에, https://git-lfs.github.com/ 1. 업로드 하려는 local 저장소에서 git lfs install 2. git lfs track "*.csv" ** "원하는 확장자 or 특정파일명" 3. push 하면 시간 다소 걸리지만 잘 올라간다
[heroku deploy] heroku app 빌드 시 이슈사항 streamlit 과 heroku 활용하여 app 배포 과정 중 이슈사항. heroku 배포 전체 과정은 그냥 여기 참고하면 된다.. https://anarinsk.github.io/lostineconomics-v2-1/coding-tool/python/web-tool/2020/03/09/Streamlit-Heroku.html Streamlit + Heroku Python 만으로 웹 앱을 만들어보자 anarinsk.github.io 나는 github에 100mb 이상의 파일을 올려야 해서 git - lsf 라는걸 사용했는데 여기서 이슈사항이 발생. local -> github -> heroku 로 되는 흐름인거같은데 git-lsf로 100mb파일을 github에서 heroku로 push하는것이 잘되지 않..
[Python] 리스트 내 리스트들 합치기 이중리스트 안에 있는 리스트들을 합쳐 하나의 리스트로 만들어야하는 경우에 sum을 이용하면 간단하게 해결가능하다 예를들어, list_a = [[1,2],[3,4]] 와 같은 이중 리스트를 sum(list_a , [] ) 와 같은 코드를 사용하여 하나의 리스트로 합칠 수 있다. list_a = [[1,2],[3,4]] sum(list_a , [])
[Pandas] Insert 활용하기 기존 데이터프레임에 새로운 열을 추가할 경우 맨 마지막 컬럼으로 추가된다. insert()를 사용하면 추가할 열의 위치,이름,데이터까지 한번에 지정가능하다. df.insert(loc, label, value) # 첫번째 열에 "fisrt column"이란 column name을 가진 [1,2,3,4]의 데이터를 추가한다 # [1,2,3,4] => Series df.insert(0, "fisrt column", [1,2,3,4]
[Pandas] apply 사용 시 index 활용 꿀팁 별거 아닌거 같지만..나름 한참 헤매이다 찾은거라 포스팅 해놓는다. 나는 lambda를 주로 사용하기보다는 좀 더 직관적으로 사용할 수 있는 apply를 애용한다 오늘도 custom함수를 만들어 apply를 하던 중 애로사항이 발생하였는데.. custom함수에서 적용하려는 DataFrame의 index에 접근해야하는데 뭘해도 안되는 경우였다 x.index를 아무리 찍어봐도 DataFrame 전체 index를 반환할뿐이였다 한참 구글링하다가 역시 stack overflow에 모든 답이있음을 다시 한번 느꼈다. name 이라는 메서드를 사용하면 인덱스를 해당 row별 index를 반환할수 있다! def get_index(x): print(x.name) ## row별 index 반환 df.apply(get_i..
[데이콘] 펀다 매출 예측_시계열 분석 보호되어 있는 글입니다.