개발/Kaggle

Breast Cancer Wisconsin (Diagnostic) Data Set

----___<<<<< 2020. 4. 20. 22:48

https://www.kaggle.com/uciml/breast-cancer-wisconsin-data

 

Breast Cancer Wisconsin (Diagnostic) Data Set

Predict whether the cancer is benign or malignant

www.kaggle.com

유방암 예측 관련 데이터입니다.

 

Attribute Information:

1) ID number
2) Diagnosis (M = malignant, B = benign)
3-32)

Ten real-valued features are computed for each cell nucleus:

a) radius (mean of distances from center to points on the perimeter)
b) texture (standard deviation of gray-scale values)
c) perimeter
d) area
e) smoothness (local variation in radius lengths)
f) compactness (perimeter^2 / area - 1.0)
g) concavity (severity of concave portions of the contour)
h) concave points (number of concave portions of the contour)
i) symmetry
j) fractal dimension ("coastline approximation" - 1)

The mean, standard error and "worst" or largest (mean of the three
largest values) of these features were computed for each image,
resulting in 30 features. For instance, field 3 is Mean Radius, field
13 is Radius SE, field 23 is Worst Radius.

All feature values are recoded with four significant digits.

Missing attribute values: none

Class distribution: 357 benign, 212 malignant

 

 

속성 정보 :

1) 아이디 번호
2) 진단 (M = 악성, B = 양성)
3-32)

각 세포핵에 대해 10 개의 실수 값이 계산됩니다.

a) 반경 (중심에서 둘레의 지점까지의 거리의 평균)
b) 질감 (회색조 값의 표준 편차)
c) 둘레
d) 지역
e) 부드러움 (반지름 길이의 국소 적 변동)
f) 콤팩트 함 (perimeter ^ 2 / area-1.0)
g) 오목 함 (형상 부의 오목한 부분의 심각도)
h) 오목 점 (형상의 오목한 부분 수)
i) 대칭
j) 프랙탈 차원 ( "해상도 근사"-1)

평균, 표준 오차 및 "최악"또는 최대 (세 가지 평균
각 이미지에 대해이 기능 중 가장 큰 값)을 계산했습니다.
30 가지 기능이 있습니다. 예를 들어, 필드 3은 평균 반경, 필드
13은 Radius SE, 필드 23은 최악 Radius입니다.

모든 피처 값은 4 자리 유효 숫자로 기록됩니다.

누락 된 속성 값 : 없음

클래스 분포 : 357 양성, 212 악성

 

와 같이 데이터가 되었습니다.

 

 

 

 

 

 

 

 

 

 

 

 

 

참고

[1] - https://github.com/cosmicudemy/ML_Casestudies

'개발 > Kaggle' 카테고리의 다른 글

Confusion Matrix  (0) 2020.04.21
GridSearchCV  (0) 2020.04.21
Kaggle 문제를 풀고 느낀 점  (0) 2020.04.19
boxplot  (0) 2020.04.19
Restaurant Revenue Prediction  (0) 2020.04.19