butter_shower
-
Butter Shower
Butter Shower
1년차 머신러닝 개발자의 와글와글 머신러닝 블로그!
인기 글
-
매력적인 깃허브 프로필을 만들어보아요 🌻
매력적인 깃허브 프로필을 만들어보아요 🌻
2020.08.08이 글은 깃허브 사용법에 관한 글이 아닙니다 ✖️ 깃허브 프로필 예쁘게 꾸미기에 관한 글입니다. ⭕ 깃허브 관련해서는 이전 포스트 개발자의 교양을 참고해주세요! :) 2020/07/27 - [🌱] - 개발자의 교양 (2) - 버전 관리와 Git, 그리고 Github 개발자의 교양 (2) - 버전 관리와 Git, 그리고 Github 버전관리란? 특정 시점의 진행 상황을 저장해두고, 언제 다시 돌아오더라도 그 시점으로부터 다시 시작할 수 있도록 관리하는.. -
나의 구글 SW개발 인턴 도전기 (구글 여성 소프트웨어캠프 4기)
나의 구글 SW개발 인턴 도전기 (구글 여성 소프트웨어캠프 4기)
2019.12.07https://korea.googleblog.com/2019/09/DevelopwithGoogle.html?m=1 구글코리아가 ‘구글 여성 소프트웨어 캠프’ 4기를 모집합니다! *프로그램 시작일이 1월 7일(화)에서 1월 6일(월)로 변경되었습니다. 구글코리아가 ‘ 구글 여성 소프트웨어 캠프 (Develop with Google)’ 4기 참가자를 모집합니다! 지난 2017년 처음 개최된 ‘구글 여성 소프트웨어 ... korea.googleblog.com 구글 여성 소프트웨어 캠프 = STEP (Student Tra.. -
구글 푸바 챌린지(Google Foobar Challenge) Level 5까지 끝낸 후기!
구글 푸바 챌린지(Google Foobar Challenge) Level 5까지 끝낸 후기!
2020.12.30푸바 챌린지 (Foobar Challenge)란? 구글의 Secret hiring process로, 구글에 검색하다 보면 재미있는 invitation을 주어 문제를 풀면 비공식 hiring process를 진행할 수 있는 챌린지입니다. 챌린지에 대한 자세한 내용은 이전 포스팅을 참고해주시길 바랍니다. 😊 이전 포스팅 : 2020/12/06 - [🌱] - 구글 푸바 챌린지에 참가하고 있습니당 - Google Foobar Challenge 구글 푸바 챌린지에 참가하고 있습니당 - Google Foobar C..
최신 글
-
[서평] 머신러닝 실무 프로젝트
[서평] 머신러닝 실무 프로젝트
2022.04.24안녕하세요! 오늘 서평할 책은 <머신러닝 실무 프로젝트> 입니다. 인상깊었던 & 알게되었던 부분 사실 이커머스 IT 회사에서 머신러닝 엔지니어로 근무하면서 생각했던것들이 많이 있어서 조금 놀랐습니다. 머신러닝 모델의 성능이 잘 나오는것도 중요하지만 결국 가장 중요한것은 회사에 이익을 줄 수 있어야 하는 것이기 때문에 우리 이러저러해서 성능이 좋아졌어요! 해도 그게 실제로 클릭률(CTR)이나 전환률(CVR) 그래서.. -
[서평] 처음 배우는 딥러닝 챗봇
[서평] 처음 배우는 딥러닝 챗봇
2022.03.31어쩌다보니 NLP 책을 많이 읽고있는데... 이번에 읽은 책은 [처음 배우는 딥러닝 챗봇]이라는 책입니다. 책 제목에서 알 수 있듯이 처음 NLP를 접하고, 처음 챗봇을 구현하려고 하는 사람에게 적절한 책이었습니다. 사실 읽으면서 되게 놀랐던게, 생각보다 진짜 '챗봇을 만들거야!!!' 라고 서비스를 처음부터 끝까지 설명을 잘 해주는 책이어서 정말 재미있고 쉽게 따라할 수 있었던 것 같아요. 인상깊었던 & 알게되었던 부분.. -
토큰화(tokenize)란?
토큰화(tokenize)란?
2022.02.17토큰화 토큰화란? 단위별 토큰화 1. 단어 단워 토큰화 2. 문자 단위 토큰화 3. 서브워드 단위 토큰화 바이트 페어 인코딩 (BPE, Byte Pair Encoding) 장점 BPE를 활용한 토큰화 절차 워드피스 (wordpiece) 토큰화 토큰화란? 문장을 토큰 시퀀스로 나누는 과정. 수행 대상에 따라 문자, 단어, 서브워드 등 세가지 방법 존재 단위별 토큰화 1. 단어 단위 토큰화 단어(어절) 단위 토큰화. 쉽게는 공백으로 구분 예시) 어제 카페 갔.. -
[서평] Do it! BERT와 GPT로 배우는 자연어 처리
[서평] Do it! BERT와 GPT로 배우는 자연어 처리
2022.01.10안녕하세요? 오랜만에 책 서평으로 돌아왔습니다 ㅎㅎ 이번에 읽은 책은 이지스퍼블리싱의 따끈따끈한 새로운 책, Do it! BERT와 GPT로 배우는 자연어 처리 입니다 😄 BERT와 GPT를 직접 사용해보면서 배우는 자연어 처리 이 책을 읽으면서 들었던 생각은 정말 설명을 잘했다!! 라는 것입니다. 저도 자연어쪽은 사실 대충 이런거 저런거가 있다라는 정도만 알고있는데요, 정말 이해하기 쉽고 간단하게 설명이 되어있습니다. 그.. -
2021년을 회고합니다
2021년을 회고합니다
2022.01.082022년 새해가 밝았지만.. 작년 회고에 이어 올해도 회고를 작성합니다!! 🙂 2020년을 회고합니다 - 인턴십, 취준과 취업, 정처기 주저리주저리 쓰는 글이라 오랜만에 다시 반말로 하겠습니다..! 신나게 시작한 SAP 인턴쉽! 2020년도 1월부터 7월까지 6개월간 SAP Korea에서 Student Intern으로 근무할 수 있었다. 너무나도 가고 싶은 기 butter-shower.tistory.com 졸업, 그리고 본격적인 개발자 시작 2021년 1월부터 11번가에.. -
[pyspark/빅데이터기초] Parquet(파케이) 파일 형식이란?
[pyspark/빅데이터기초] Parquet(파케이) 파일 형식이란?
2021.11.17파케이(parquet)이란 하둡에서 칼럼방식으로 저장하는 저장 포맷을 말합니다. 파케이는 프로그래밍 언어, 데이터 모델 혹은 데이터 처리 엔진과 독립적으로 엔진과 하둡 생태계에 속한 프로젝트에서 칼럼 방식으로 데이터를 효율적으로 저장하여 처리 성능을 비약적으로 향상시킬 수 있습니다. 열(Column)기반 압축을 하고있는데 이는 칼럼의 데이터가 연속된 구조로 저장되어 있다. Row 중심으로 저장되어있는 것과는 아래 사진..