Big Data Tools là một trong những plugin JetBrains đầu tiên nhằm giải quyết các vấn đề liên quan đến cả mã và dữ liệu.
JetBrains Blog, 20.5.2020 – Vào cuối năm ngoái, chúng tôi đã công bố bản xem trước của plugin IntelliJ IDEA Ultimate tích hợp các máy tính xách tay Apache Zeppelin vào IDE. Đồng thời, chúng tôi đã chia sẻ lộ trình của mình, trong đó chúng tôi hứa sẽ hỗ trợ nhiều công cụ hơn để làm việc với Big Data. Kể từ đó, nhóm plugin đã làm việc chăm chỉ và đã mở rộng plugin với sự hỗ trợ cho các tệp Apache Spark, Apache Hadoop’s HDFS, AWS S3, Google Cloud Storage và Parquet.
Vì plugin ban đầu bắt đầu với sự hỗ trợ Scala trong máy tính xách tay Zeppelin, nên nó chỉ hợp lý khi nó chỉ có sẵn cho IntelliJ IDEA Ultimate. Giờ đây, plugin hỗ trợ tập hợp các kịch bản và công cụ rộng hơn nhiều, đã đến lúc nó có sẵn cho các IDE khác. Cùng với đó, chúng tôi rất vui mừng thông báo rằng Công cụ Dữ liệu Lớn hiện cũng có sẵn cho DataGrip và PyCharm Professional.
Big Data Tools là một trong những plugin JetBrains đầu tiên nhằm giải quyết các vấn đề liên quan đến cả mã và dữ liệu.
Tại sao DataGrip và PyCharm? Big Data Tools là một trong những plugin JetBrains đầu tiên nhằm giải quyết các vấn đề liên quan đến cả mã và dữ liệu. Vì plugin cung cấp các công cụ để làm việc với dữ liệu, chúng tôi nghĩ rằng nó hợp lý để cung cấp plugin cho người dùng DataGrip. Chúng tôi tin rằng plugin sẽ mở rộng khả năng của người dùng DataGrip khi làm việc với các hệ thống lưu trữ tệp phân tán và các định dạng tệp cột. Đồng thời, người dùng PyCharm sử dụng PySpark hoặc cũng làm việc với dữ liệu sẽ được hưởng lợi từ việc có sẵn plugin này trong IDE của họ.
Một lưu ý quan trọng là Big Data Tools vẫn còn trong EAP và có một số hạn chế. Một trong những hạn chế quan trọng nhất hiện nay là phiên bản plugin hiện tại cho PyCharm và DataGrip cung cấp tất cả các tính năng có sẵn trong IntelliJ IDEA ngoại trừ máy tính xách tay Zeppelin. Thêm hỗ trợ máy tính xách tay Zeppelin nằm trong lộ trình của chúng tôi và chúng tôi hy vọng sẽ sớm có nó.
Bộ tính năng hiện tại bao gồm:
- Trình duyệt file cho các hệ thống lưu trữ tệp phân tán, chẳng hạn như AWS S3, HDFS, GCS (cũng sẽ sớm hỗ trợ lưu trữ đám mây khác, ví dụ: Microsoft Azure). Với trình duyệt này, bạn có thể duyệt các folder và file, xem trước file và quản lý file, ví dụ: tạo, sao chép, đổi tên, xóa, tải lên và tải xuống chúng.
- Trình xem các định dạng file dạng cột, chẳng hạn như Parquet (hỗ trợ cho các định dạng khác cũng sẽ sớm ra mắt, ví dụ: Avro và ORC).
- Một bảng điều khiển giám sát cho các cụm Spark. Với bảng điều khiển này, bạn có thể duyệt các nút cụm, công việc Spark, các giai đoạn và tác vụ của chúng.
Xin lưu ý rằng plugin hiện có sẵn cho các IDE có số phiên bản 2020.1 trở lên.
Thông tin bổ sung về plugin có thể được tìm thấy trong kho plugin.
Tài liệu cho plugin hiện có sẵn cho cả DataGrip và PyCharm.
Cách dễ nhất để cài đặt plugin là bằng cách mở cài đặt IDE IDE Plugin, nhấp vào Marketplace, tìm kiếm “Big Data Tools”, cài đặt và sau đó khởi động lại IDE.
Hãy dùng thử plugin, chia sẻ phản hồi của bạn và lan truyền!
ViHoth (Dịch)