2021년 3월 25일 용인시 부동산 경매 데이터 분석
경기도 용인시 처인구 중부대로1313번길 12, 6층603호 [집합건물 철근콘크리트조 81.66㎡]
항목 | 값 |
---|---|
경매번호 | 2020타경9854 |
경매날짜 | 2021.04.08 |
법원 | 수원지방법원 |
담당 | 경매18계 |
감정평가금액 | 128,000,000 |
경매가 | 89,600,000(70%) |
유찰여부 | 유찰\t1회 |
<최근 1년 실거래가 정보>
– 총 거래 수: 0건
– 동일 평수 거래 수: 0건
2021년 3월 25일 수원시 부동산 경매 데이터 분석
경기도 수원시 장안구 파장로 50, 에이동 3층401호 (파장동,소망빌라) [집합건물 벽돌조 41.16㎡]
항목 | 값 |
---|---|
경매번호 | 2020타경11437 |
경매날짜 | 2021.04.08 |
법원 | 수원지방법원 |
담당 | 경매18계 |
감정평가금액 | 73,000,000 |
경매가 | 51,100,000(70%) |
유찰여부 | 유찰\t1회 |
- 다세대주택으로 이용 중임.
<최근 1년 실거래가 정보>
– 총 거래 수: 0건
– 동일 평수 거래 수: 0건
2021년 3월 24일 모바일 게임 매출 순위
Rank | Game | Publisher |
---|---|---|
1 | 리니지M | NCSOFT |
2 | 리니지2M | NCSOFT |
3 | Cookie Run: Kingdom – Kingdom Builder & Battle RPG | Devsisters Corporation |
4 | 기적의 검 | 4399 KOREA |
5 | Genshin Impact | miHoYo Limited |
6 | 삼국지 전략판 | Qookka Games |
7 | 원펀맨: 최강의 남자 | GAMENOW TECHNOLOGY |
8 | 그랑사가 | NPIXEL |
9 | V4 | NEXON Company |
10 | 리니지2 레볼루션 | Netmarble |
11 | 라이즈 오브 킹덤즈 | LilithGames |
12 | 이카루스 이터널 | LINE Games |
13 | 세븐나이츠2 | Netmarble |
14 | A3: 스틸얼라이브 | Netmarble |
15 | PUBG MOBILE | KRAFTON, Inc. |
16 | 뮤 아크엔젤 | Webzen Inc. |
17 | 바람의나라: 연 | NEXON Company |
18 | 미르4 | Wemade Co., Ltd |
19 | S.O.S:스테이트 오브 서바이벌 | KingsGroup Holdings |
20 | R2M | Webzen Inc. |
21 | 블레이드&소울 레볼루션 | Netmarble |
22 | Roblox | Roblox Corporation |
23 | KartRider Rush+ | NEXON Company |
24 | 메이플스토리M | NEXON Company |
25 | Brawl Stars | Supercell |
26 | 프린세스 커넥트! Re:Dive | Kakao Games Corp. |
27 | FIFA ONLINE 4 M by EA SPORTS™ | NEXON Company |
28 | 카운터사이드 | NEXON Company |
29 | 검은강호2: 이터널 소울 | 9SplayDeveloper |
30 | AFK 아레나 | LilithGames |
31 | Gardenscapes | Playrix |
32 | 라그나로크 오리진 | GRAVITY Co., Ltd. |
33 | Top War: Battle Game | Topwar Studio |
34 | Age of Z Origins | Camel Games Limited |
35 | Pmang Poker : Casino Royal | NEOWIZ corp |
36 | 찐삼국 | ICEBIRD GAMES |
37 | 갑부: 장사의 시대 | BLANCOZONE NETWORK KOREA |
38 | Lords Mobile: Kingdom Wars | IGG.COM |
39 | Homescapes | Playrix |
40 | FIFA Mobile | NEXON Company |
41 | 한게임 포커 | NHN BIGFOOT |
42 | 달빛조각사 | Kakao Games Corp. |
43 | Cookie Run: OvenBreak – Endless Running Platformer | Devsisters Corporation |
44 | 검은사막 모바일 | PEARL ABYSS |
45 | Epic Seven | Smilegate Megaport |
46 | Mafia City | YottaGame |
47 | Empires & Puzzles: Epic Match 3 | Small Giant Games |
48 | 에오스 레드 | BluePotion Games |
49 | Gunship Battle Total Warfare | JOYCITY Corp. |
50 | 황제라 칭하라 | Clicktouch Co., Ltd. |
Multivariate Outlier Detection in Python -번역
파이썬에서 다 변수 이상 탐지
다 변수 아웃리어와 파이썬에서 Mahalanobis 거리
다 변수 데이터의 특이점을 감지하면 종종 데이터 전처리의 문제 중 하나 일 수 있습니다. 단계.특이점을 감지하는 다양한 거리 메트릭, 점수 및 기술이 있습니다.유클리드 거리는 중심점까지의 거리를 기반으로 한 이상을 식별하는 가장 알려진 거리 메트릭 중 하나입니다.또한 단일 숫자 변수에 대한 이상을 정의하는 z 점수가 있습니다.경우에 따라 클러스터링 알고리즘도 선호 될 수 있습니다.이러한 모든 방법은 다른 관점에서 이상 치를 고려합니다.하나의 방법을 기반으로 한 이상이 다른 방법으로 발견되지 않을 수 있습니다.따라서 이러한 방법 및 메트릭은 변수의 배포를 고려하여 선택해야합니다.그러나 이것은 다른 메트릭의 요구도 가져옵니다.이 기사에서는 MahalAnobis 거리라는 거리 메트릭을 다 변수 할 수있는 데이터의 특이점을 감지하기 위해 논의 할 것입니다.
Mahalanobis 거리
Mahalanobis 거리 (MD)는 점과 분포 사이의 거리를 찾는 유효 거리 측정 기준입니다 (또한보십시오짐마자데이터 포인트와 중심 간의 거리를 찾기 위해 변수의 공분산 행렬을 사용하기 때문에 다 변수 데이터에 매우 효과적으로 작동합니다 (공식 1 참조).즉, EUCLIDEAN 거리와 달리 데이터 포인트의 배포 패턴을 기반으로 한 이상을 감지 함을 의미합니다.그 차이를 이해하려면 그림 1을 참조하십시오.

그림 1에서 볼 수 있듯이 데이터 포인트는 특정 방향으로 흩어져 있습니다.유클리드의 거리는 그러한 분포의 이상 치명적인 지점을 할당 할 수 있지만 Mahalanobis 거리가 계속 유지 될 수 있습니다.이것은 그림 2에서 본 비선형 관계에도 동일합니다.

이 차이의 주된 이유는 공분산식이 변수가 어떻게 변화 하는지를 나타내기 때문에 공분산 행렬입니다.N 차원 공간의 중앙과 포인트 사이의 거리를 계산하는 동안 공분산을 사용하면 변화에 따라 진정한 임계 값 테두리를 찾는 기능이 있습니다.화학식 1에 도시 된 MD의 거리 공식으로부터 알 수있는 바와 같이, 공분산 매트릭스는 C로서 C이고 그것의 부정적인 제 1 능력이 취해졌다.벡터 XPI는 n 차원 공간에서 관측 좌표를 나타냅니다.예를 들어 세 가지 변수, 첫 번째 행이있는 데이터 세트가있는 경우 다음과 같이 두 번째 행을 나타낼 수 있습니다.XP1 : [13,15,23] 및 XP2 : [12,14,15]
…에그러나 이상 치를 식별하는 동안, 각 포인트 사이의 거리를 찾는 대신 중심과 각 관찰 사이의 거리가 발견되어야합니다.중심점은 각 변수의 평균값을 취하여 얻을 수 있습니다.

참고 : 그림 1과 2에 주어진 예제 데이터와 달리 변수가 원면에 대부분 흩어지면 유클리드 거리가 더 적합 할 수 있습니다.
파이썬과 Mahalanobis 거리
예, 파이썬을 사용하여 Mahalanobis 거리를 찾을 시간입니다.파이썬 대신 r에 관심이 있으시면 다른 기사를 살펴볼 수 있습니다.
‘scipy’라이브러리에서 Mahalanobis 거리가 있습니다.이 메서드에 액세스 할 수 있습니다scipy.spatial.distance.mahalanobis.
또한 세부 사항을 볼 수 있습니다여기…에이 방법을 사용하는 대신, 다음 단계에서는 수식 1에서 주어진 공식을 사용하여 Mahalanobis 거리를 계산하는 자체 방법을 작성하게 될 것입니다.
“AirQuality”라는 데이터 세트를 사용하고 변수 “오존”및 “TEMP”를 사용하여 오위 이상을 감지합니다.이 데이터 세트를 다운로드 할 수 있습니다여기또는 데이터 세트를 사용하십시오.
첫째, 필요한 라이브러리와 데이터 세트를 가져와야합니다.데이터 세트를 계산을 준비하려면 “오존”및 “온도”변수 만 선택되어야합니다.게다가, 아무런 오류가 있지 않아야합니다.또한 Pandas 데이터 프레임을 사용하는 대신 numpy 배열을 사용하는 것을 선호합니다.그래서 내가이를 숫자 배열로 변환했습니다.
두 번째 단계에서는 센터와 포인트 사이의 거리를 계산하기 위해 필요한 값을 얻어야합니다.따라서 “오존”과 “온도”변수 사이의 중심점과 공분산 매트릭스입니다.
세 번째 단계의 경우 데이터 세트의 중심점과 각 관측 (포인트) 사이의 거리를 찾을 준비가되었습니다.우리는 또한 Chi-square 배포에서 컷오프 값을 찾아야합니다.Chi-square가 컷오프 값을 찾는 데 사용되는 이유는 Mahalanobis 거리가 제곱 된 (d²)로 거리를 반환합니다.또한 0.95 (2 꼬리) 외부의 포인트가 이상으로 간주되므로 컷오프를 찾는 동안 컷오프를 찾아야합니다.짧은 양은 컷오프 값이 적습니다.우리는 또한 Chi-square에 대한 자유 값이 필요하며 데이터 세트의 변수 수와 동일합니다.
마지막으로, 우리는 [24, 35, 67, 81]의 인덱스에 4 가지 이상의 특이점이 있습니다.이제이 과정을 더 분명하게 이해하고 계획을 세우십시오.
그리고 여기서 우리는 그림 3에서 볼 수 있듯이, 포인트는 아웃리어로 탐지 된 타원 밖에서 머물러 있습니다.이 ellipse는 MD에 따라 아웃 리어 값을 래핑하는 영역을 나타냅니다.

다음은 무엇입니까?
이 기사에서는 Mahalanobis 거리와 유클리드 거리와의 차이가 논의되었습니다.우리는 또한 파이썬에서 Mahalanobis 거리 공식을 처음부터 적용했습니다.이전에 언급했듯이 데이터가 N 차원 공간에 흩어져있는 방법을 기반으로 거리 측정 항목을 선택하는 것이 중요합니다.다른 거리 메트릭을 살펴볼 수도 있습니다.요리 거리…에
질문이 있으시면 언제든지 코멘트를 남겨주세요.
사용을 따라 이상을 감지하는 방법에 관심이있는 경우 다른 기사를 확인할 수 있습니다.R.의 Mahalanobis 거리…에
Multivariate Outlier Detection in Python
Multivariate Outlier Detection in Python
Multivariate Outliers and Mahalanobis Distance in Python
Detecting outliers in multivariate data can often be one of the challenges of the data preprocessing phase. There are various distance metrics, scores, and techniques to detect outliers. Euclidean distance is one of the most known distance metrics to identify outliers based on their distance to the center point. There is also a Z-Score to define outliers for a single numeric variable. In some cases, clustering algorithms can be also preferred. All these methods consider outliers from different perspectives. The outliers are found based on one method may not be found by the others as outliers. Therefore, these methods and metrics should be chosen by considering the distribution of the variables. However, this brings out the needs of different metrics too. In this article, we will be discussing the distance metric called Mahalanobis Distance for detecting outliers in multivariable data.
Mahalonobis Distance
Mahalanobis Distance (MD) is an effective distance metric that finds the distance between the point and distribution (see also). It works quite effectively on multivariate data because it uses a covariance matrix of variables to find the distance between data points and the center (see Formula 1). This means that MD detects outliers based on the distribution pattern of data points, unlike the Euclidean distance. Please see Figure 1 to understand the difference.

As can be seen from Figure 1, data points are scattered in a certain direction. While Euclidean distance can assign some non-outlier points as outliers in such distributions, Mahalanobis distance can keep up with it. This is also the same for the non-linear relations as seen from Figure-2.

The main reason for this difference is the covariance matrix because covariance indicates how variables variate together. Using covariance while calculating distance between center and points in n-dimensional space provides finding true threshold border based on the variation. As can be seen from the distance formula of MD shown in Formula 1, the covariance matrix had presented as C and the negative first power of it had taken. The vectors Xpi represent coordinates of observations in n-dimensional space. For example, suppose there is a data-set with three variables, its first row, and the second row can be represented like this: Xp1:[13,15,23] and Xp2:[12,14,15]
. However, while identifying outliers, the distance between the center and each observation should be found instead of finding the distance between each point. The center point can be obtained by taking the average value of each variable.

Note: Unlike the example data, given in Figures 1 and 2, when the variables are mostly scattered in a circle, the euclidean distance may be a more suitable option.
Mahalanobis Distance with Python
Yes, it’s time to find the Mahalanobis distance using Python. If you are interested in R instead of Python, you can take a look at my other article.
There is a method for Mahalanobis Distance in the ‘Scipy’ library. You can access this method from scipy.spatial.distance.mahalanobis.
You can also see its details here. Instead of using this method, in the following steps, we will be creating our own method to calculate Mahalanobis Distance by using the formula given at the Formula 1.
I will be using the data-set called “airquality” and detect outliers only using variables “Ozone” and “Temp”. Either, you can download this data set from here or use your data-set.
First, we should import the necessary libraries and the data-set. To make the data-set ready for the calculations, only the variables “Ozone” and “Temp” should be selected. Plus, not to face any error NA values should be dropped if there is any. Also, I prefer to use the NumPy array instead of using pandas data frame. That’s why I converted it to a NumPy array.
For the second step, we need to obtain the necessary values to calculate the distance between center and point. So, these are the center point and covariance matrix between the “Ozone” and “Temp” variables.
For the third step, we are ready to find the distance between the center point and each observation (point) in the data-set. We also need to find a cutoff value from the Chi-Square distribution. The reason why Chi-Square is used to find cutoff value is, Mahalanobis Distance returns the distance as squared (D² ). We should also take the quantile value as 0.95 while finding cutoff because the points outside the 0.95 (two-tailed) will be considered as an outlier. Less quantile means less cutoff value. We also need a degree of freedom value for Chi-Square, and it is equal to the number of variables in our data-set, so 2.
Finally, we have four outliers at the index of [24, 35, 67, 81]. Now, let’s make and plot to understand this process more clearly.
And here we go, as you can see from Figure 3, the points stay outside the ellipse detected as an outlier. This ellipse represents the area that wraps non-outlier values according to MD.

What is Next?
In this article, Mahalanobis Distance and its difference from Euclidean distance has discussed. We also have applied the Mahalanobis Distance formula on Python from scratch. As it’s mentioned before, it is important to choose a distance metric based on how data scattered in n-dimensional space. You can also have a look at the other distance metric called Cook Distance.
If you have any questions please feel free to leave a comment.
You can check my other article if you are interested in how to detect outliers by using Mahalanobis Distance in R.
2021년 3월 24일 용인시 부동산 경매 데이터 분석
경기도 용인시 기흥구 동백평촌로 39, 1202동 13층1302호 (동백동,호수마을동보노빌리티) [집합건물 철근콘크리트구조 84.898㎡]
항목 | 값 |
---|---|
경매번호 | 2020타경60293 |
경매날짜 | 2021.04.07 |
법원 | 수원지방법원 |
담당 | 경매15계 |
감정평가금액 | 414,000,000 |
경매가 | 414,000,000(100%) |
유찰여부 | 신건 |
<최근 1년 실거래가 정보>
– 총 거래 수: 0건
– 동일 평수 거래 수: 0건
2021년 3월 23일 모바일 게임 매출 순위
Rank | Game | Publisher |
---|---|---|
1 | 리니지M | NCSOFT |
2 | 리니지2M | NCSOFT |
3 | Cookie Run: Kingdom – Kingdom Builder & Battle RPG | Devsisters Corporation |
4 | 기적의 검 | 4399 KOREA |
5 | 삼국지 전략판 | Qookka Games |
6 | Genshin Impact | miHoYo Limited |
7 | 원펀맨: 최강의 남자 | GAMENOW TECHNOLOGY |
8 | 그랑사가 | NPIXEL |
9 | V4 | NEXON Company |
10 | 리니지2 레볼루션 | Netmarble |
11 | 라이즈 오브 킹덤즈 | LilithGames |
12 | 세븐나이츠2 | Netmarble |
13 | 이카루스 이터널 | LINE Games |
14 | A3: 스틸얼라이브 | Netmarble |
15 | PUBG MOBILE | KRAFTON, Inc. |
16 | 뮤 아크엔젤 | Webzen Inc. |
17 | 바람의나라: 연 | NEXON Company |
18 | S.O.S:스테이트 오브 서바이벌 | KingsGroup Holdings |
19 | 미르4 | Wemade Co., Ltd |
20 | R2M | Webzen Inc. |
21 | 블레이드&소울 레볼루션 | Netmarble |
22 | Roblox | Roblox Corporation |
23 | KartRider Rush+ | NEXON Company |
24 | 메이플스토리M | NEXON Company |
25 | Brawl Stars | Supercell |
26 | 프린세스 커넥트! Re:Dive | Kakao Games Corp. |
27 | FIFA ONLINE 4 M by EA SPORTS™ | NEXON Company |
28 | 검은강호2: 이터널 소울 | 9SplayDeveloper |
29 | AFK 아레나 | LilithGames |
30 | 카운터사이드 | NEXON Company |
31 | Gardenscapes | Playrix |
32 | Pmang Poker : Casino Royal | NEOWIZ corp |
33 | Top War: Battle Game | Topwar Studio |
34 | 라그나로크 오리진 | GRAVITY Co., Ltd. |
35 | Age of Z Origins | Camel Games Limited |
36 | 찐삼국 | ICEBIRD GAMES |
37 | 갑부: 장사의 시대 | BLANCOZONE NETWORK KOREA |
38 | Lords Mobile: Kingdom Wars | IGG.COM |
39 | Homescapes | Playrix |
40 | Empires & Puzzles: Epic Match 3 | Small Giant Games |
41 | FIFA Mobile | NEXON Company |
42 | Cookie Run: OvenBreak – Endless Running Platformer | Devsisters Corporation |
43 | 한게임 포커 | NHN BIGFOOT |
44 | 달빛조각사 | Kakao Games Corp. |
45 | Epic Seven | Smilegate Megaport |
46 | 검은사막 모바일 | PEARL ABYSS |
47 | Mafia City | YottaGame |
48 | 에오스 레드 | BluePotion Games |
49 | 가디언 테일즈 | Kakao Games Corp. |
50 | Gunship Battle Total Warfare | JOYCITY Corp. |