Tìm HiểU Khả Năng Tương Thích CủA Zodiac Sign
Cách các nhà báo có thể sử dụng Geocommons để tạo bản đồ tương tác
Khác
Một vài tháng trước, John Keefe đã viết một Poynter.org How To về việc sử dụng shapefiles. Sức mạnh của shapefile, ông viết, là khả năng tham chiếu đến các vùng thay vì các điểm.
Nhưng nếu dữ liệu của bạn có các điểm (ví dụ: địa chỉ) và bạn muốn lập bản đồ các vùng? Ví dụ: giả sử bạn có các địa chỉ vi phạm môi trường và bạn muốn cho biết khu vực quốc hội nào có nhiều vi phạm nhất. Bạn cần tìm cách liên kết những điểm đó thành hình dạng. Trong hướng dẫn này, tôi sẽ giải thích cách thực hiện điều đó.
Hãy sử dụng một ví dụ từ tổ chức mà tôi đang làm việc, Sunlight Foundation. Chúng tôi có một trang web tên là Dữ liệu minh bạch , nơi người dùng có thể tải xuống dữ liệu, một số dữ liệu bao gồm địa chỉ. Một trong những tập dữ liệu như vậy là dữ liệu vi phạm EPA. Đi tới Dữ liệu minh bạch, nhấp vào tab “EPA”, sau đó tìm kiếm các vi phạm từ ngày 1 tháng 7 năm 2011 đến ngày 31 tháng 12 năm 2011. Dữ liệu minh bạch sẽ trả về khoảng 1.300 bản ghi. Nhấp vào nút “Tải xuống dữ liệu” khổng lồ để lưu các bản ghi vào máy tính của bạn.
Sau khi chúng tôi tải xuống dữ liệu đó, chúng tôi sẽ mở nó trong một bảng tính. Bạn sẽ thấy rằng một trong các cột bao gồm địa chỉ của vi phạm. (Lưu ý, một số ô trong cột này bao gồm nhiều địa chỉ, trong khi những ô khác hoàn toàn không có địa chỉ. Vì mục đích của chúng tôi, chúng tôi sẽ loại bỏ bất kỳ bản ghi nào có nhiều địa chỉ hoặc những ô không có bất kỳ địa chỉ nào. Bạn có thể tham khảo câu chuyện trước đó, “Cách các nhà báo có thể sử dụng Excel để sắp xếp dữ liệu cho các câu chuyện” nếu bạn cần trợ giúp để thực hiện việc này.)
Chúng ta cũng nên tách địa chỉ thành các phần thành phần của chúng. Tôi sẽ tạo các cột mới cho thành phố, tiểu bang và ZIP.
(Bạn có thể tham khảo một trong những Cách thực hiện trước đây của tôi - “Cách nhà báo có thể sử dụng cụm từ thông dụng để khớp các chuỗi văn bản” để được trợ giúp về vấn đề này. Gợi ý, tìm kiếm / thay thế của tôi là tìm kiếm:
, (.*), ([A-Z][A-Z]) (ddddd.*)
và thay thế bằng:
1 2 3
Điều đó sẽ để lại một số lỗi (chẳng hạn như số căn hộ trong trường thành phố), chúng tôi sẽ sửa lỗi này bằng cách tìm kiếm:
(.*, )
và thay thế bằng:
, 1
Khi dữ liệu đã được làm sạch, chúng tôi sẽ đưa dữ liệu đó trở lại bảng tính của mình. Sau đó, chúng tôi sẽ xuất bảng tính đó ra dưới dạng tệp văn bản .csv hoặc 'giá trị được phân tách bằng dấu phẩy' cung cấp cho bạn tệp trông giống như thế này .)
Bây giờ, để tổng hợp các địa chỉ này với các khu vực quốc hội, chúng tôi sẽ sử dụng một trong những công cụ yêu thích của tôi: GeoCommons . Chúng tôi sẽ bắt đầu quá trình này bằng cách xuất bảng tính ở trên dưới dạng CSV hoặc tệp văn bản 'các giá trị được phân tách bằng dấu phẩy'. Tôi đã đăng một tệp ví dụ ở đây . Sau đó, chúng tôi sẽ tải trực tiếp CSV đó lên GeoCommons.
Khi tải lên GeoCommons, chúng tôi sẽ làm theo lời nhắc cho đến khi dịch vụ yêu cầu chúng tôi “giúp định vị địa lý” dữ liệu. Chúng tôi được đưa ra hai lựa chọn. Đầu tiên, chúng ta có thể liên kết hoặc kết hợp dữ liệu với một tập dữ liệu ranh giới. Nếu chúng tôi chọn tùy chọn này, chúng tôi sẽ cần dữ liệu ranh giới trong bảng tính. Dữ liệu đó có thể bao gồm tên quận hoặc mã FIPS, mã quận quốc hội, vùng điều tra dân số và những thứ tương tự. Chúng tôi không có những trường đó trong dữ liệu của mình.
Tùy chọn thứ hai, 'mã địa lý dựa trên địa chỉ hoặc tên địa điểm', lấy thông tin vị trí, chẳng hạn như địa chỉ đường phố và chuyển đổi thông tin đó thành kinh độ và vĩ độ. Đây là tùy chọn chúng tôi muốn chọn.
Tùy thuộc vào tiêu đề trong tệp của bạn, GeoCommons có thể tự động phân biệt một số trường vị trí. Nếu không, chúng tôi sẽ cần giúp GeoCommons xác định trường nào tạo nên địa chỉ. Để làm điều đó, chúng tôi sẽ cuộn xuống “địa chỉ vị trí” và chọn “chỉnh sửa”. Ở đó, chúng tôi sẽ chọn “địa chỉ đường phố”. Chúng tôi cũng sẽ làm như vậy đối với thành phố, tiểu bang và mã ZIP. Sau đó nhấp vào “Tiếp tục”. (Lưu ý, GeoCommons chỉ có thể mã hóa địa lý tối đa 5.000 địa chỉ cho mỗi tệp.) Bạn cũng có thể điều chỉnh các kiểu dữ liệu trường khác nếu bạn muốn hoặc cần.
Dịch vụ sẽ mất một khoảng thời gian để giải mã các địa chỉ và biến chúng thành các điểm kinh độ và vĩ độ. Khi kết thúc quá trình đó, GeoCommons sẽ cho chúng tôi biết khả năng định vị địa lý các địa chỉ của nó tốt như thế nào. Trong thử nghiệm của tôi, quá trình mã hóa địa lý mất khoảng 10 phút. (Nếu bạn không muốn đợi tệp của mình mã hóa địa lý, vui lòng sử dụng bản sao dữ liệu của tôi, có sẵn đây .) Tất nhiên, bạn cũng có thể sử dụng các dịch vụ khác để mã hóa địa lý dữ liệu thành vĩ độ và kinh độ, sau đó tải lên CSV chứa các trường đó - ngoài tất cả các trường khác - lên GeoCommons.
Tiếp theo, chúng tôi sẽ tận dụng một trong những tính năng tốt nhất của GeoCommons: Khả năng phân tích dữ liệu của nó. Nếu chúng tôi truy cập tập dữ liệu mới được mã hóa địa lý của mình, chúng tôi có thể truy cập các tính năng này bằng cách nhấp vào nút 'phân tích' ở phía trên bên phải của trang.
Điều này mang lại một loạt các tùy chọn. Bạn nên dành một chút thời gian để chơi với những công cụ này, nhưng đối với hướng dẫn này, chúng tôi sẽ chọn công cụ thứ hai, “Tổng hợp”. Trên hộp thoại kết quả, chúng ta cần chọn một tập hợp ranh giới. Một cửa sổ sẽ bật lên và chúng tôi sẽ tìm kiếm “Các quận thuộc Quốc hội thứ 111”. Tại đó, chúng tôi sẽ chọn các quận mà tôi đã tải lên. Các quận này ở dạng shapefiles, là phương pháp mô tả các khu vực dựa trên vector.
Tôi đã bỏ chọn 'Giữ các ranh giới trống' vì tôi không muốn hiển thị các quận không có vi phạm nào.
GeoCommons bây giờ sẽ thực hiện phân tích của nó, trong trường hợp của tôi, mất khoảng 20 phút. Tệp kết quả được định vị đây .
Mặc dù bạn có thể ánh xạ tập dữ liệu kết quả trong GeoCommons, nhưng tôi thấy rằng bản đồ của dịch vụ quá hạn chế. Ví dụ: bạn không có toàn quyền kiểm soát cách thông tin trong chú giải công cụ bản đồ được định dạng.
Vì lý do đó, tôi muốn xuất bản đồ ra khỏi GeoCommons bằng chức năng “Tải xuống dưới dạng KML”. Tệp KML xuất GeoCommons chứa tất cả dữ liệu cũng như thông tin ranh giới. Với tệp này, tôi có thể chuyển sang Google Fusion Tables, nhập KML và có toàn quyền kiểm soát thiết kế, đổ bóng, cửa sổ thông tin và hơn thế nữa. John Keefe đã đề cập điều đó trong phần giới thiệu của anh ấy về các tệp định dạng, vì vậy tôi sẽ không đề cập đến vấn đề này.
Mặc dù tôi thường không sử dụng Geocommons cho bản đồ hoàn chỉnh, nhưng nó là một công cụ vô giá để tạo bản đồ thông tin và hấp dẫn, đặc biệt là khi xử lý các ranh giới hoặc khu vực.
Chúc bạn khám phá vui vẻ và hãy chia sẻ trải nghiệm của bạn với GeoCommons và lập bản đồ trong phần nhận xét. Nếu bạn có các chủ đề khác mà bạn muốn đề cập / đề cập đến loạt bài này, hãy cho chúng tôi biết.
Câu chuyện này là một phần của một Poynter Tin tặc / Tin tặc loạt phim có Làm thế nào để tập trung vào những gì các nhà báo có thể học hỏi từ các xu hướng mới nổi trong công nghệ và các công cụ công nghệ mới.