분류 전체보기
-
저번에 이미 [Goodnotes 파일에서 MP3 파일을 추출하는 방법]을 다뤘었는데요. 지금 다시 보면, Colab을 처음 접하는 분들에게는 사용하기가 힘들었을 것 같습니다. 또한, 모바일에서는 사용하기 어려움이 있었을 텐데요. 그래서 이번에는 누구나 쉽게 어느 기기에서든 사용할 수 있도록 웹 어플리케이션 형태로 제작해보았습니다. How to use? Goodnotes 앱에서 .goodnotes 파일 추출하기 먼저 추출을 원하는 노트로 들어가서 상단에 `공유하기 버튼을 클릭`합니다. (아래 사진처럼 공유하기 버튼이 없으면 ··· 클릭하여 공유 버튼 클릭) `[모두 보내기]를 클릭`합니다. `GoodNotes로 선택 후 [보내기]를 클릭`한 후 파일을 저장합니다. MP3 파일로 추출하기 이제 아래 사이트로..
[APP] Goodnotes 파일에서 녹음파일(MP3) 추출하기저번에 이미 [Goodnotes 파일에서 MP3 파일을 추출하는 방법]을 다뤘었는데요. 지금 다시 보면, Colab을 처음 접하는 분들에게는 사용하기가 힘들었을 것 같습니다. 또한, 모바일에서는 사용하기 어려움이 있었을 텐데요. 그래서 이번에는 누구나 쉽게 어느 기기에서든 사용할 수 있도록 웹 어플리케이션 형태로 제작해보았습니다. How to use? Goodnotes 앱에서 .goodnotes 파일 추출하기 먼저 추출을 원하는 노트로 들어가서 상단에 `공유하기 버튼을 클릭`합니다. (아래 사진처럼 공유하기 버튼이 없으면 ··· 클릭하여 공유 버튼 클릭) `[모두 보내기]를 클릭`합니다. `GoodNotes로 선택 후 [보내기]를 클릭`한 후 파일을 저장합니다. MP3 파일로 추출하기 이제 아래 사이트로..
2023.09.24 -
이번 게시글에서는 Kaggle에서 Whisper JAX를 이용하여 mp3 파일을 텍스트로 변환하고 자막을 생성하는 방법을 알려드리려고 합니다. Colab / Kaggle 버전 차이 저번 게시글에서 [Colab에서 mp3 파일 텍스트 변환하는 방법]에 대해 알아보았는데요. Colab 버전과 Kaggle 버전의 차이점은 다음과 같았습니다. 지원 모델 접근성 소요 시간 기타사항 Colab Small / Medium 상대적으로 쉬움. (Interactive Markdown 지원) Kaggle에 비해 오래 걸림. 구글 계정 필요 Kaggle Small / Medium / Large 과정이 colab에 비해 복잡하여 어려울 수 있음. Large 모델도 Colab보다 빠르게 텍스트를 얻을 수 있음. Kaggle 가입..
[STT] OpenAI Whisper로 mp3 파일 텍스트 변환 및 자막 생성하기 (Kaggle Version)이번 게시글에서는 Kaggle에서 Whisper JAX를 이용하여 mp3 파일을 텍스트로 변환하고 자막을 생성하는 방법을 알려드리려고 합니다. Colab / Kaggle 버전 차이 저번 게시글에서 [Colab에서 mp3 파일 텍스트 변환하는 방법]에 대해 알아보았는데요. Colab 버전과 Kaggle 버전의 차이점은 다음과 같았습니다. 지원 모델 접근성 소요 시간 기타사항 Colab Small / Medium 상대적으로 쉬움. (Interactive Markdown 지원) Kaggle에 비해 오래 걸림. 구글 계정 필요 Kaggle Small / Medium / Large 과정이 colab에 비해 복잡하여 어려울 수 있음. Large 모델도 Colab보다 빠르게 텍스트를 얻을 수 있음. Kaggle 가입..
2023.07.14 -
이번 게시글에서는 Colab으로 OpenAI Whisper with Jax를 이용하여 mp3 파일을 텍스트로 변환하고 자막을 생성하는 방법을 소개해드리려고 합니다. ※ 사용법은 바로 [OpenAI Whipser mp3 파일 텍스트 변환하기]부터 읽으시면 됩니다. 프로젝트 목표 이번 프로젝트 개발 동기를 한 문장으로 정리하면 '교수님의 (영어 전용 전공) 강의 녹음 파일를 텍스트로 변환하자!' 입니다. (자세한 개발동기 및 프로젝트 목표는 다음 게시글을 참고해주세요.) 이미 유튜브나 구글에 Open Whisper를 검색해보면 다양한 사용법을 확인할 수 있습니다. 하지만 제 생각에는 아직까지 접근성은 많이 떨어지는 것 같네요. 특히, 로컬 환경에 맞게 세팅하고 사용하는 것은 만만치 않고, 내 컴퓨터의 GPU..
[STT] OpenAI Whisper로 mp3 파일 텍스트 변환 및 자막 생성하기 (Colab Version)이번 게시글에서는 Colab으로 OpenAI Whisper with Jax를 이용하여 mp3 파일을 텍스트로 변환하고 자막을 생성하는 방법을 소개해드리려고 합니다. ※ 사용법은 바로 [OpenAI Whipser mp3 파일 텍스트 변환하기]부터 읽으시면 됩니다. 프로젝트 목표 이번 프로젝트 개발 동기를 한 문장으로 정리하면 '교수님의 (영어 전용 전공) 강의 녹음 파일를 텍스트로 변환하자!' 입니다. (자세한 개발동기 및 프로젝트 목표는 다음 게시글을 참고해주세요.) 이미 유튜브나 구글에 Open Whisper를 검색해보면 다양한 사용법을 확인할 수 있습니다. 하지만 제 생각에는 아직까지 접근성은 많이 떨어지는 것 같네요. 특히, 로컬 환경에 맞게 세팅하고 사용하는 것은 만만치 않고, 내 컴퓨터의 GPU..
2023.07.12 -
이번 게시글에서는 GoodNotes 앱에서 녹음한 오디오 파일을 추출하는 방법에 대해 설명하려고 합니다. ※ 사용법이 궁금하신분들은 바로 [Goodnotes 파일에서 녹음 파일 추출하기]부터 읽으시면 됩니다. 개발 동기 Goodnotes에서도 노타빌리티처럼 녹음 기능을 지원하기 시작했는데요. 저는 이 기능을 사용하여 실시간 강의를 녹음하고 복습할 때 같이 들으면서 공부하는데, 항상 ‘교수님의 강의 내용(특히, 영어 전용 전공 강의를 들을때마다..)을 자막으로 변환해주면 좋겠다!’라는 생각을 많이 했습니다. 그래서 이러한 프로그램들을 찾아보았는데, 대부분 회원가입이 필요하고 음성 파일의 시간 제한이 걸려있는 경우가 많았습니다. (대부분 강의 녹음 시간이 1시간이 넘는데 ㅠ..) 결과적으로 ‘비용을 내고 서..
[GoodNotes] GoodNotes 녹음 파일 추출 및 텍스트 변환하기이번 게시글에서는 GoodNotes 앱에서 녹음한 오디오 파일을 추출하는 방법에 대해 설명하려고 합니다. ※ 사용법이 궁금하신분들은 바로 [Goodnotes 파일에서 녹음 파일 추출하기]부터 읽으시면 됩니다. 개발 동기 Goodnotes에서도 노타빌리티처럼 녹음 기능을 지원하기 시작했는데요. 저는 이 기능을 사용하여 실시간 강의를 녹음하고 복습할 때 같이 들으면서 공부하는데, 항상 ‘교수님의 강의 내용(특히, 영어 전용 전공 강의를 들을때마다..)을 자막으로 변환해주면 좋겠다!’라는 생각을 많이 했습니다. 그래서 이러한 프로그램들을 찾아보았는데, 대부분 회원가입이 필요하고 음성 파일의 시간 제한이 걸려있는 경우가 많았습니다. (대부분 강의 녹음 시간이 1시간이 넘는데 ㅠ..) 결과적으로 ‘비용을 내고 서..
2023.07.11 -
/* 본 게시물은 ' Introduction to MachineLearning with Python | 안드레이스 뮐러, 세라 가이도 ' 의 내용과 참고자료를 토대로 작성되었습니다. */ /* 본 글은 개인적으로 공부한 내용을 정리한 글이므로 오류가 있을 수 있습니다. */ 1. 결정트리란? 결정트리는 분류와 회귀 문제에 널리 사용하는 모델이다. 기본적으로 결정 트리는 결정에 다다르기 위해 예/아니오 질문을 이어 나가면서 학습한다. (스무고개와 비슷하다.) 결정트리 장점 트리를 시각화하면 데이터가 어떻게 분류(예측)되는지 확인이 가능하다. 데이터의 스케일에 영향을 받지 않는다. 각 특성이 개별적으로 처리되어 데이터를 분할하는데 데이터 스케일의 영향을 받지 않으므로 결정 트리에서는 특성의 정규화나 표준화 ..
[Machine Learning with Python / Chapter 2.1] 결정 트리/* 본 게시물은 ' Introduction to MachineLearning with Python | 안드레이스 뮐러, 세라 가이도 ' 의 내용과 참고자료를 토대로 작성되었습니다. */ /* 본 글은 개인적으로 공부한 내용을 정리한 글이므로 오류가 있을 수 있습니다. */ 1. 결정트리란? 결정트리는 분류와 회귀 문제에 널리 사용하는 모델이다. 기본적으로 결정 트리는 결정에 다다르기 위해 예/아니오 질문을 이어 나가면서 학습한다. (스무고개와 비슷하다.) 결정트리 장점 트리를 시각화하면 데이터가 어떻게 분류(예측)되는지 확인이 가능하다. 데이터의 스케일에 영향을 받지 않는다. 각 특성이 개별적으로 처리되어 데이터를 분할하는데 데이터 스케일의 영향을 받지 않으므로 결정 트리에서는 특성의 정규화나 표준화 ..
2022.05.05 -
/* 본 게시물은 ' ' 의 내용과 참고자료를 토대로 작성되었습니다. */ /* 본 글은 개인적으로 공부한 내용을 정리한 글이므로 오류가 있을 수 있습니다. */ Colab 라이브러리 추가하기 1. Google Drive -> Colab Notebooks -> my_env 폴더 생성 2. colab으로 아래 코드 실행 (google drive / my-env로 경로 설정) import os, sys from google.colab import drive drive.mount('/content/drive') my_path = '/content/notebooks' # Colab Notebooks 안에 my_env 폴더에 패키지 저장 os.symlink('/content/drive/My Drive/Colab ..
[Colab] Colab에서 라이브러리 추가/* 본 게시물은 ' ' 의 내용과 참고자료를 토대로 작성되었습니다. */ /* 본 글은 개인적으로 공부한 내용을 정리한 글이므로 오류가 있을 수 있습니다. */ Colab 라이브러리 추가하기 1. Google Drive -> Colab Notebooks -> my_env 폴더 생성 2. colab으로 아래 코드 실행 (google drive / my-env로 경로 설정) import os, sys from google.colab import drive drive.mount('/content/drive') my_path = '/content/notebooks' # Colab Notebooks 안에 my_env 폴더에 패키지 저장 os.symlink('/content/drive/My Drive/Colab ..
2022.03.17 -
/* 본 게시물은 ' 파이썬 라이브러리를 활용한 데이터 분석 2판 | with 웨스 맥키니 ' 의 내용과 참고자료를 토대로 작성되었습니다. */ /* 본 글은 개인적으로 공부한 내용을 정리한 글이므로 오류가 있을 수 있습니다. */ 색인 객체 색인(Index) 객체란? pandas 의 색인 객체는 표 형식의 데이터에서 각 로우와 컬럼에 대한 이름과 다른 메타데이터(축의 이름 등)을 저장하는 객체이다. Series 나 DataFrame 객체를 생성할 때 사용되는 배열(리스트, ndarray, 튜플 등)나 다른 순차적인 이름은 내부적으로 색인으로 변환된다. 예시를 통해 확인해보자. 색인 객체 예시 obj = pd.Series(range(3), index=['a', 'b', 'b']) index = obj.i..
[Data Science / Chapter 2.4] Pandas 자료구조 - 색인 객체/* 본 게시물은 ' 파이썬 라이브러리를 활용한 데이터 분석 2판 | with 웨스 맥키니 ' 의 내용과 참고자료를 토대로 작성되었습니다. */ /* 본 글은 개인적으로 공부한 내용을 정리한 글이므로 오류가 있을 수 있습니다. */ 색인 객체 색인(Index) 객체란? pandas 의 색인 객체는 표 형식의 데이터에서 각 로우와 컬럼에 대한 이름과 다른 메타데이터(축의 이름 등)을 저장하는 객체이다. Series 나 DataFrame 객체를 생성할 때 사용되는 배열(리스트, ndarray, 튜플 등)나 다른 순차적인 이름은 내부적으로 색인으로 변환된다. 예시를 통해 확인해보자. 색인 객체 예시 obj = pd.Series(range(3), index=['a', 'b', 'b']) index = obj.i..
2022.03.04 -
/* 본 게시물은 ' 파이썬 라이브러리를 활용한 데이터 분석 2판 | with 웨스 맥키니 ' 의 내용과 참고자료를 토대로 작성되었습니다. */ /* 본 글은 개인적으로 공부한 내용을 정리한 글이므로 오류가 있을 수 있습니다. */ DataFrame 1. DataFrame 이란? DataFrame 은 표 같은 스프레드시트 형식의 자료구조이다. (엑셀을 생각하면 된다.) 여러 개의 칼럼이 있는데 각 칼럼은 서로 다른 종류의 값(숫자, 문자열, 불리언 등)을 담을 수 있다. DataFrame은 로우와 컬럼에 대한 색인을 가지고 있는데, 색인의 모양이 같은 Series 객체를 담고 있는 다른 컬렉션이 아니라 하나 이상의 2차원 배열에 저장한다. 2. DataFrame 다루기 DataFrame 객체 생성하기 D..
[Data Science / Chapter 2.3] Pandas 자료구조 - DataFrame/* 본 게시물은 ' 파이썬 라이브러리를 활용한 데이터 분석 2판 | with 웨스 맥키니 ' 의 내용과 참고자료를 토대로 작성되었습니다. */ /* 본 글은 개인적으로 공부한 내용을 정리한 글이므로 오류가 있을 수 있습니다. */ DataFrame 1. DataFrame 이란? DataFrame 은 표 같은 스프레드시트 형식의 자료구조이다. (엑셀을 생각하면 된다.) 여러 개의 칼럼이 있는데 각 칼럼은 서로 다른 종류의 값(숫자, 문자열, 불리언 등)을 담을 수 있다. DataFrame은 로우와 컬럼에 대한 색인을 가지고 있는데, 색인의 모양이 같은 Series 객체를 담고 있는 다른 컬렉션이 아니라 하나 이상의 2차원 배열에 저장한다. 2. DataFrame 다루기 DataFrame 객체 생성하기 D..
2022.03.03 -
/* 본 게시물은 ' 파이썬 라이브러리를 활용한 데이터 분석 2판 | with 웨스 맥키니 ' 의 내용과 참고자료를 토대로 작성되었습니다. */ /* 본 글은 개인적으로 공부한 내용을 정리한 글이므로 오류가 있을 수 있습니다. */ Pandas 자료구조 - Series pandas의 대표적인 자료구조인 Series, DataFrame 에 대해 알아보자. 이 두 가지 자료구조를 배우면 대부분의 애플리케이션에서 사용하기 쉬우며 탄탄한 기반이 되어줄 것이다. Series Series는 일련의 객체를 담을 수 있는 1차원 배열 같은 자료구조이다. 그리고 색인(index) 이라고 하는 배열의 데이터와 연관된 이름을 가지고 있다. ( 파이썬의 Dictionary형과 비슷하다) Series 객체 생성하기 # inde..
[Data Science / Chapter 2.2] Pandas 자료구조 - Series/* 본 게시물은 ' 파이썬 라이브러리를 활용한 데이터 분석 2판 | with 웨스 맥키니 ' 의 내용과 참고자료를 토대로 작성되었습니다. */ /* 본 글은 개인적으로 공부한 내용을 정리한 글이므로 오류가 있을 수 있습니다. */ Pandas 자료구조 - Series pandas의 대표적인 자료구조인 Series, DataFrame 에 대해 알아보자. 이 두 가지 자료구조를 배우면 대부분의 애플리케이션에서 사용하기 쉬우며 탄탄한 기반이 되어줄 것이다. Series Series는 일련의 객체를 담을 수 있는 1차원 배열 같은 자료구조이다. 그리고 색인(index) 이라고 하는 배열의 데이터와 연관된 이름을 가지고 있다. ( 파이썬의 Dictionary형과 비슷하다) Series 객체 생성하기 # inde..
2022.02.23 -
/* 본 게시물은 ' 파이썬 라이브러리를 활용한 데이터 분석 2판 | with 웨스 맥키니 ' 의 내용과 참고자료를 토대로 작성되었습니다. */ /* 본 글은 개인적으로 공부한 내용을 정리한 글이므로 오류가 있을 수 있습니다. */ Pandas란? Pandas 란? pandas는 데이터 조작 및 분석을 위한 Python 으로 작성된 라이브러리이다. 고수준의 자료구조와 파이썬에서 빠르고 쉽게 사용할 수 있는 데이터 분석 도구를 포함하고 있다. (라이브러리는 Cython 또는 C로 작성된 코드를 사용하여 성능에 대해 최적화가 되어 있다.) pandas 는 다른 산술 계산 도구인 Numpy 와 Scipy, 분석 라이브러리인 statsmodels 와 scikit-learn, 시각화 도구인 matplotlib 과..
[Data Science / Chapter 2.1] Pandas란?/* 본 게시물은 ' 파이썬 라이브러리를 활용한 데이터 분석 2판 | with 웨스 맥키니 ' 의 내용과 참고자료를 토대로 작성되었습니다. */ /* 본 글은 개인적으로 공부한 내용을 정리한 글이므로 오류가 있을 수 있습니다. */ Pandas란? Pandas 란? pandas는 데이터 조작 및 분석을 위한 Python 으로 작성된 라이브러리이다. 고수준의 자료구조와 파이썬에서 빠르고 쉽게 사용할 수 있는 데이터 분석 도구를 포함하고 있다. (라이브러리는 Cython 또는 C로 작성된 코드를 사용하여 성능에 대해 최적화가 되어 있다.) pandas 는 다른 산술 계산 도구인 Numpy 와 Scipy, 분석 라이브러리인 statsmodels 와 scikit-learn, 시각화 도구인 matplotlib 과..
2022.02.23 -
/* 본 게시물은 ' ' 의 내용과 참고자료를 토대로 작성되었습니다. */ /* 본 글은 개인적으로 공부한 내용을 정리한 글이므로 오류가 있을 수 있습니다. */ 제목 참고 자료 [URL] :
[Data Science / Chapter 1.7] Numpy 기본 사용법(6) - 선형대수/* 본 게시물은 ' ' 의 내용과 참고자료를 토대로 작성되었습니다. */ /* 본 글은 개인적으로 공부한 내용을 정리한 글이므로 오류가 있을 수 있습니다. */ 제목 참고 자료 [URL] :
2022.02.23 -
/* 본 게시물은 ' 파이썬 라이브러리를 활용한 데이터 분석 2판 | with 웨스 맥키니 ' 의 내용과 참고자료를 토대로 작성되었습니다. */ /* 본 글은 개인적으로 공부한 내용을 정리한 글이므로 오류가 있을 수 있습니다. */ 난수 생성 Numpy.random 모듈 numpy.random 모듈은 파이썬 내장 random 함수를 보강하여 다양한 종류의 확률분포로부터 효과적으로 표본값을 생성하는데 주로 사용된다. 표본정규분포 표본 생성 randomData = np.random.normal(size=(4,4)) print(randomData) """ [[ 5.96710372e-01 -5.86135000e-01 1.19199216e-01 -1.90140372e+00] [ 9.86277664e-01 3.92..
[Data Science / Chapter 1.6] Numpy 기본 사용법(5) - 난수 생성 (Random)/* 본 게시물은 ' 파이썬 라이브러리를 활용한 데이터 분석 2판 | with 웨스 맥키니 ' 의 내용과 참고자료를 토대로 작성되었습니다. */ /* 본 글은 개인적으로 공부한 내용을 정리한 글이므로 오류가 있을 수 있습니다. */ 난수 생성 Numpy.random 모듈 numpy.random 모듈은 파이썬 내장 random 함수를 보강하여 다양한 종류의 확률분포로부터 효과적으로 표본값을 생성하는데 주로 사용된다. 표본정규분포 표본 생성 randomData = np.random.normal(size=(4,4)) print(randomData) """ [[ 5.96710372e-01 -5.86135000e-01 1.19199216e-01 -1.90140372e+00] [ 9.86277664e-01 3.92..
2022.02.21