1986년 로이터에서 공개한 짧은 뉴스 기사와 토픽의 집합인 데이터. 텍스트 분류를 위해 널리 사용되는 간단한 데이터셋으로 46개의 토픽이 있고 어떤 토픽은 다른 것에 비해 데이터가 많다. 각 토픽은 훈련 세트에 최소한 10개의 샘플을 가지고 있다. (이 데이터셋은 원본 로이터 데이터셋(135개 토픽) 중 샘플이 많은 것을 뽑아 간단하게 만든 것) defalt값으로 8,982개의 훈련 샘플과 2,246개의 테스트 샘플이 있음. IMDB, MNIST와 마친가지로 케라스에 포함되어 있다. IMDB과 마찬가지로 미리 전체 데이터셋의 단어를 고유한 정수 인덱스로 바꾼 후 훈련/테스트 데이터로 나누어 놓았다. >> 자세한 코드 & 설명 gggggeun/study Contribute to gggggeun/study..