글 읽기 - 제 코드가 무엇이 문제일까요?(반례는 찾았지만 원인을 못찾고 있습니다)

4hn6 3년 전 1

먼저 브루트포스로 다음과 같은 반례를 찾았습니다.

35 43

44 44

9 48

40 70

39 84

79 14

82 82

위 인풋의 정해는 82이고, 제 코드는 197를 출력합니다. 정해의 경우 (35, 43), (44, 44)를 선택한 것 같고, 제 코드의 경우 (39, 84), (40, 70)을 선택한 것 같습니다.

아마 제 코드는 분할정복을 하는 과정에서 중심좌표를 기준으로 왼쪽, 오른쪽 구역으로 나누었을 때 가장 가까운 두 점이 왼쪽 구역에 하나, 오른쪽 구역에 하나 있을 때 잘못된 답이 출력되는 것 같습니다.

이유는 모르겠지만 38번째 줄을 sort(point+head, point+tail, compare);에서 sort(point+head, point+tail+1, compare);로 바꾸면 위 반례 한정 정해가 나옵니다...(다른 반례들에서는 안먹히기도 함)

제가 생각한 문제원인은 함수가 재귀적으로 호출되는 과정에서 가장 가까운 두 점이 왼쪽 구역에 하나, 오른쪽 구역에 하나 있을 때를 체크하기 위해 y좌표 기준으로 정렬할때 문제가 생기는 것 같습니다.
예를들어서 1, 2, 3, 4, 5, 6이라는 배열이 존재할 때 {3, 4, 5}라는 부분을 y좌표 기준으로 정렬해야하는데 재귀호출로 인해 수행된 함수에서 이 과정을 진행하면서 배열의 자리가 바뀌어 {2, 4, 7}이런식으로 되어버려 다른 결과가 나오지 않을까 하는 생각을 했습니다.

그래서 코드를 73번째 줄 아래와 같이, 함수가 호출되면 새로운 vector pair를 만들어 그 곳에 값들을 복사하여 원본 값을 바꾸지 않도록 바꾸었습니다.

그런데 이렇게 바꿔도 여전히 위 테스트 케이스를 입력하면 오답인 197을 출력하고 있습니다...

이게 문제가 아니라면 무엇이 문제일까요?

#include <iostream>
#include <algorithm>
#include <utility>
#include <cmath>
using namespace std;

typedef long long ll;

pair<int, int> point[100000];

bool compare(const pair<int, int> &a, const pair<int ,int> &b)
{
    return a.second < b.second;
}

int dis(int p1, int p2)
{
    return (int)(pow(point[p1].first-point[p2].first, 2) + pow(point[p1].second-point[p2].second, 2));
}

int check(int start, int n)
{
    if(n == 2) return dis(start, start+1);
    if(n == 3) return min({dis(start, start+1), dis(start+1, start+2), dis(start+2, start)});

    int dl = check(start, n/2+1);
    int dr = check(start+n/2, n%2 == 0 ? n/2 : n/2+1);
    int dm = min(dl, dr);

    int head;
    for(head = start + n/2; head != start; head--)
        if(pow(abs(point[start+n/2].first-point[head].first), 2) >= dm) break;

    int tail;
    for(tail = start + n/2; tail != start+n; tail++)
        if(pow(abs(point[start+n/2].second-point[tail].second), 2) >= dm) break;

    sort(point+head, point+tail, compare);

    for(int i = head; i < tail; i++)
    {
        for(int j = i+1; j < tail; j++)
        {
            if(pow(abs(point[i].second-point[j].second), 2) >= dm) break;
            dm = min(dm, dis(i, j));
        }
    }

    return dm;
}

int main()
{
    int n;
    scanf("%d", &n);
    for(int i = 0; i < n; i++)
    {
        int x, y;
        scanf("%d%d", &x, &y);
        point[i] = make_pair(x, y);
    }

    sort(point, point+n);

    printf("%d", check(0, n));

    return 0;
}




//////////////////////////////////////////////////////////////////////

#include <iostream>
#include <algorithm>
#include <utility>
#include <cmath>
#include <vector>
using namespace std;

typedef long long ll;

vector<pair<int, int>> p;

bool comp(const pair<int, int> &a, const pair<int, int> &b)
{
    return a.first < b.first;
}

bool compare(const pair<int, int> &a, const pair<int, int> &b)
{
    return a.second < b.second;
}

int dis(vector<pair<int, int>>::iterator p1, vector<pair<int ,int>>::iterator p2)
{
    return (int)(pow(p1->first-p2->first, 2) + pow(p1->second-p2->second, 2));
}

int check(vector<pair<int, int>>::iterator s, vector<pair<int, int>>::iterator l, int n)
{
    vector<pair<int, int>> point;
    for(vector<pair<int, int>>::iterator iter = s; iter != l; iter++) point.push_back(pair<int, int>(*iter));
    vector<pair<int, int>>::iterator start = point.begin(), last = point.end();

    if(n == 2) return dis(start, start+1);
    if(n == 3) return min({dis(start, start+1), dis(start+1, start+2), dis(start+2, start)});

    vector<pair<int, int>>::iterator mid = start;
    for(int i = 0; i < n/2; i++, mid++)
    {
    }
    int dl = check(start, mid+1, n/2+1);
    int dr = check(mid, last, n%2 == 0 ? n/2 : n/2+1);
    int dm = min(dl, dr);

    sort(point.begin(), point.end());
    vector<pair<int, int>>::iterator head = lower_bound(start, mid+1, pair<int, int>(dm, 0), comp);
    head++;
    vector<pair<int, int>>::iterator tail = lower_bound(mid, last, pair<int, int>(dm, 0), comp);

    sort(head, tail, compare);

    for(vector<pair<int, int>>::iterator i = head; i != tail; i++)
    {
        for(vector<pair<int, int>>::iterator j = i+1; j != tail; j++)
        {
            if(pow(abs(i->second-j->second), 2) >= dm) break;
            dm = min(dm, dis(i, j));
        }
    }

    return dm;
}

int main()
{
    int n;
    scanf("%d", &n);
    for(int i = 0; i < n; i++)
    {
        int x, y;
        scanf("%d%d", &x, &y);
        p.push_back(pair<int, int>(make_pair(x, y)));
    }

    sort(p.begin(), p.end());

    printf("%d", check(p.begin(), p.end(), n));

    return 0;
}

3587jjh 3년 전 1

전자 코드의 문제점은 분석하신 바가 맞습니다. 후자 코드의 경우 문법적인 부분을 제외하고서라도 방법상에 많은 문제점이 보이는데요, 의도된 것인지 아닌지는 별개로 우려되는 부분들을 써봅니다.

1. 114째줄과 115째줄의 재귀호출하는 범위가 하나는 [start, mid+1) 이고 하나는 [mid, last)인데 두 범위가 mid에서 겹칩니다.

2. check함수에서 기존 인자로 받은 iterator의 대상이 되는 배열과 재귀호출로 넘기는 iterator의 대상이 되는 배열이 다릅니다.

보통은 모든 호출의 iterator의 대상을 p로 하면서, 각 check함수에서 따로 p의 해당 [s, l) 점들을 임시 배열에 복사하여 이 배열을 가지고 탐색합니다.

3. head부터 tail까지 2중 for문으로 후보 거리를 찾는데 탐색 시간을 줄이기 위해 119~121째줄에서 lower_bound를 사용한 것으로 보이나

의미를 잘 모르겠습니다. dm은 거리의 개념인데 위치를 담은 배열에서 거리를 이분탐색? 거리가 x좌표로 해석될것같은데, 음 뭔가 이상한것같습니다.

4. 결정적으로 125~132째줄에서 2중 for문을 이용하여 하나하나 다 찾아보는데에는 호출된 check의 구간 길이를 l이라 했을 때 최악의 경우 O(l^2)이 걸립니다.

(모든 점들의 x좌표가 같은 경우, 모든 점들의 y좌표가 같은 경우 등등을 고려해봤을 때.)

분할정복의 호출 횟수는 logn번이라고 하면 최종 시간복잡도가 O(n^2 logn)이 되어 시간초과가 납니다. 해당 구간의 모든 점들을 y좌표의 오름차순

(y좌표가 같으면 x의 오름차순) 으로 정렬했을 때, 자신 이후의 약 6~8개의 점까지의 거리만 보는것으로 충분하다는 것이 알려져 있습니다. 한번 찾아보시면 좋을 것 같습니다.

4hn6 3년 전 0

답변 감사합니다!

답변해주신 점을 반영하여 첫번째 코드를 수정하여 새로 짜보았습니다.

1. 왼쪽구역과 오른쪽 구역에서 각각 점이 하나만 있는 경우를 볼때 30-36번째 줄을 추가하여 원본값이 유지되도록 하였습니다.

2. y좌표의 오름차순으로 정렬했을 때, 자신 이후의 약 6~8개의 점까지의 거리만 보는것으로 충분하다는 것을 반영하여 40-47번째 줄을 수정하였습니다.

3. dl, dr의 범위겹침문제는 dl이 [start, start+n/2] dr이 [start+n/2, 끝]을 커버하도록 하였는데, 이는 (start+n/2)번째 원소를 왼쪽 구역과 오른쪽 구역을 나누는 기준으로 하기위함입니다.

그런데 아직까지 틀린 답을 출력하고 있습니다. 종이에 변수들의 값을 쓰면서 흐름을 읽어봐도 도저히 무엇이 문제인지 모르겠습니다...

한번만 더 봐주시면 감사하겠습니다!

#include <iostream>
#include <algorithm>
#include <utility>
#include <cmath>
using namespace std;

typedef long long ll;

pair<int, int> point[100000];

bool compare(const pair<int, int> &a, const pair<int ,int> &b)
{
    return a.second < b.second;
}

int dis(int p1, int p2)
{
    return (int)(pow(point[p1].first-point[p2].first, 2) + pow(point[p1].second-point[p2].second, 2));
}

int check(int start, int n)
{
    if(n == 2) return dis(start, start+1);
    if(n == 3) return min({dis(start, start+1), dis(start+1, start+2), dis(start+2, start)});

    int dl = check(start, n/2+1);
    int dr = check(start+n/2, n%2 == 0 ? n/2 : n/2+1);
    int dm = min(dl, dr);

    pair<int ,int> arr[100000];
    int arrsize = 0;
    for(int i = 0; i < n; i++)
    {
        if(pow(abs(point[n/2].first - point[i].first), 2) < dm)
        arr[arrsize++] = point[start+i];
    }

    sort(arr, arr+arrsize, compare);

    for(int i = 0; i < arrsize; i++)
    {
        for(int j = i+1; j < i+9 && j < arrsize; j++)
        {
            if(pow(abs(arr[i].second-arr[j].second), 2) >= dm) break;
            dm = min(dm, dis(i, j));
        }
    }

    return dm;
}

int main()
{
    int n;
    scanf("%d", &n);
    for(int i = 0; i < n; i++)
    {
        int x, y;
        scanf("%d%d", &x, &y);
        point[i] = make_pair(x, y);
    }

    sort(point, point+n);

    printf("%d", check(0, n));

    return 0;
}

3587jjh 3년 전 1

생각보다 찾기가 어려웠지만..

1. 16째줄의 dis함수는 point에 대한 것인데 45째줄에서 잘못 사용하고 있습니다

2. 34째줄의 point 시작 인덱스는 0이 아닌 start부터 입니다

4hn6 3년 전 0

친절한 답변 정말 감사드립니다!

알려주신 부분을 수정했더니 정상적인 결과를 출력하게 되었습니다.

그러나 n이 10만인 몇몇 케이스에서 1000-1100ms정도의 실행시간을 보이고 있습니다.

제가 알기로 이 알고리즘은 시간복잡도가 n(logn)^2인데, 왜 이렇게 긴 시간이 걸리는지 잘 모르겠습니다.

50-59번째 줄을 제거하고 실행하면 100ms이하의 시간이 걸리고 52=59번째 줄을 제거하고 실행하면 1000ms 이상의 시간이 걸리는 것으로 보아, arr에 point를 옮기는 과정에서 시간이 걸리는 것 같지는 않고, sort과정에서 시간이 걸리는 것 같습니다.

84번째 줄부터는 인터넷에서 찾은 코드입니다. 이 코드의 경우 제 코드가 매우 긴 시간을 보이는 테스트 케이스에서도 100ms 이하의 짧은 시간에 결과를 출력하고 있습니다. 제가 보기에는 두 코드가 이만큼 큰 실행시간의 차이를 보일 이유가 없는 것 같은데 혹시 어떤 차이가 있는 걸까요?

#include <iostream>
#include <algorithm>
#include <utility>
#include <cmath>
using namespace std;

typedef long long ll;

pair<int, int> point[100000];

bool compare(const pair<int, int> &a, const pair<int ,int> &b)
{
    if(a.second == b.second) return a.first < b.first;
    return a.second < b.second;
}

int dis(int p1, int p2)
{
    return (int)(pow(point[p1].first-point[p2].first, 2) + pow(point[p1].second-point[p2].second, 2));
}

int check(int start, int n)
{
    if(n == 2) return dis(start, start+1);
    if(n == 3) return min({dis(start, start+1), dis(start+1, start+2), dis(start+2, start)});

    int dl = check(start, n/2);
    int dr = check(start+n/2, n%2 == 0 ? n/2 : n/2+1);
    int dm = min(dl, dr);
    int line = (point[start+n/2].first + point[start+n/2-1].first)/2;

    pair<int ,int> arr[100000];
    int arrsize = 0;
    for(int i = start+n/2; i >= start; i--)
    {
        if(pow(line - point[i].first, 2) < dm)
            arr[arrsize++] = point[i];

        else break;
    }

    for(int i = start+n/2+1; i < start+n; i++)
    {
        if(pow(line - point[i].first, 2) < dm)
            arr[arrsize++] = point[i];

        else break;
    }

    sort(arr, arr+arrsize, compare);

    for(int i = 0; i < arrsize; i++)
    {
        for(int j = i+1; j < i+9 && j < arrsize; j++)
        {
            if(pow(arr[j].second-arr[i].second, 2) >= dm) break;
            dm = min(dm, (int)(pow(arr[j].second-arr[i].second, 2) + pow(abs(arr[i].first-arr[j].first), 2)));
        }
    }

    return dm;
}

int main()
{
    int n;
    scanf("%d", &n);
    for(int i = 0; i < n; i++)
    {
        int x, y;
        scanf("%d%d", &x, &y);
        point[i] = make_pair(x, y);
    }

    sort(point, point+n);

    printf("%d", check(0, n));

    return 0;
}

//////////////////////////////////////////

#include<bits/stdc++.h>
 
using namespace std;
 
struct Point {
    int x, y;
};
 
int dist(Point &p, Point &q) {
    return (p.x-q.x)*(p.x-q.x)+(p.y-q.y)*(p.y-q.y);
}
 
struct Comp {
    bool comp_in_x;
    Comp(bool b) : comp_in_x(b) {}
    bool operator()(Point &p, Point &q) {
        return (this->comp_in_x? p.x < q.x : p.y < q.y);
    }
};
 
 
int closest_pair(vector<Point>::iterator it, int n) {
    if (n == 2)
        return dist(it[0], it[1]);
    if (n == 3)
        return min({dist(it[0], it[1]), dist(it[1], it[2]), dist(it[2], it[0])});
     
    int line = (it[n/2 - 1].x + it[n/2].x) / 2;
    int d = min(closest_pair(it, n/2), closest_pair(it + n/2, n - n/2));
     
    vector<Point> mid;
    mid.reserve(n);
     
    for (int i = 0; i < n; i++) {
        int t = line - it[i].x;
        if (t*t < d)
            mid.push_back(it[i]);
    }
 
    sort(mid.begin(), mid.end(), Comp(false));
     
    int mid_sz = mid.size();
    for (int i = 0; i < mid_sz - 1; i++)
        for (int j = i + 1; j < mid_sz && (mid[j].y - mid[i].y)*(mid[j].y - mid[i].y) < d; j++)
            d = min(d, dist(mid[i], mid[j]));
     
    return d;
}
 
 
int main(void) {
    ios_base::sync_with_stdio(false);
    cin.tie(nullptr);
    cout.tie(nullptr);
 
    int n;
    cin >> n;
     
    vector<Point> points(n);
    for (auto it = points.begin(); it != points.end(); it++)
        cin >> it->x >> it->y;
     
    sort(points.begin(), points.end(), Comp(true));
     
    cout << closest_pair(points.begin(), n);
     
    return 0;
}

//코드 출처
//https://casterian.net/archives/92

4hn6 3년 전 0

n이 10만인 테스트 케이스는 https://www.acmicpc.net/board/view/33839를 참조하였습니다

3587jjh 3년 전 1

32번째줄에서 매 호출마다 길이 10만의 배열을 만들었다 없앴다 하는 것은 굉장히 부담이 크기 때문입니다.

4hn6 3년 전 0

벡터로 바꿔서 해결했습니다!!!

답변해주셔서 정말 감사합니다~~~!!!

댓글을 작성하려면 로그인해야 합니다.

문제

문제

출처

ICPC

제 코드가 무엇이 문제일까요?(반례는 찾았지만 원인을 못찾고 있습니다)

4hn6 3년 전 1

3587jjh 3년 전 1

4hn6 3년 전 0

3587jjh 3년 전 1

4hn6 3년 전 0

4hn6 3년 전 0

3587jjh 3년 전 1

4hn6 3년 전 0

Baekjoon Online Judge

채점 현황

문제

유저 대회

고등학교 대회

출처

대학교 대회

도움말