Download List

프로젝트 설명

DataCleaner is a data quality analysis tool that allows you to perform data profiling, validating, and minor ETL-like tasks. These activities help you administer and monitor your data quality in order to ensure that your data is useful and applicable to your business situation. It can be used for master data management (MDM) methodologies, data warehousing projects, statistical research, preparation for extract-transform-load activities, and more.

System Requirements

System requirement is not defined
Information regarding Project Releases and Project Resources. Note that the information here is a quote from Freecode.com page, and the downloads themselves may not be hosted on OSDN.

2013-01-22 21:29
3.1.2

웹 서비스 (목록) 메트릭 값을 얻기 위해 모니터링 응용 프로그램에 추가 되었습니다. '테이블 조회' 구성 요소 구성 가능한 속성으로 조인 의미 체계를 추가 하 여 향상 되었습니다. EasyDQ 구성 요소, 구성 옵션 및 풍부한 중복 제거 결과 인터페이스 추가 추가 업그레이드 되었습니다. 성능 향상이 릴리스의 특정 초점 되었습니다. 향상 되었습니다 Datacleaner의 엔진에서 더 이상 이전에 덮여 있었다 하는 코너 경우도 스트리밍 처리 접근을 활용 하.
Tags: Minor feature enhancements, Minor bugfixes
A Web service was added to the monitoring application for getting a (list of) metric values. The 'Table lookup' component has been improved by adding join semantics as a configurable property. The EasyDQ components have been upgraded, adding further configuration options and a richer deduplication result interface. Performance improvements have been a specific focus of this release. Improvements have been made in the engine of DataCleaner to further utilize a streaming processing approach in certain corner cases which was not covered previously.

2013-01-05 06:50
3.1.1

날짜 및 시간 관련 추가 주 번호, 월 및 년에 대 한 배포 분석기 분석 옵션 확장 되었습니다. 옵션 "통계법" 옵션에 추가 된 번호 분석기 및 날짜/시간 분석기 라인 모니터링 웹 응용 프로그램의 시간 표시 막대 차트에 그들의 작은 점 들을 만들었습니다. Uuid를 생성 하 고 타임 스탬프를 생성 하기 위한 두 개의 새로운 트랜스 포 머 추가 되었습니다. 이제 ad hoc 쿼리 고유한 절을 포함 될 수 있습니다 *-와일드 카드, 및 하위 쿼리 및 결함 허용 텍스트 경우 문제 쪽으로.
Tags: Minor feature enhancements
The date and time related analysis options have been expanded, adding distribution analyzers for week numbers, months, and years. An optional "descriptive statistics" option has been added to the Number analyzer and the Date/time analyzer The lines in the timeline charts of the monitoring Web application now have small dots in them. Two new transformers have been added for generating UUIDs and for generating timestamps. Now ad hoc queries can contain DISTINCT clauses, *-wildcards, and subqueries, and are fault-tolerant towards text-case issues.

2012-12-18 12:20
3.1

데이터 품질 Kpi 이제 수식 (수학 식), 그냥 원시 통계로 정의할 수 있습니다.
이제 모든 데이터 저장소 (DB, CSV, Excel 등)으로 임시 SQL 쿼리를 실행 하는 것이 가능 합니다. 새로운 분석 옵션 값 matcher 추가 되었습니다. 이 분석 필드에 예기치 않은 값을 식별 하는 것이 쉽습니다. 작업, 복사 및 삭제 작업을 포함 하 여 관리가 했다 훨씬 쉽게 직접 UI에서에서 기능을 노출 하 여. 그것은 역사적인 데이터 품질 통계 결과 타임 라인으로 위치를 변경 하려면 변경할 수 했다 되었습니다.
Data Quality KPIs can now be defined as formulas (mathematical expressions), not just raw metrics.
It is now possible to fire ad-hoc SQL queries towards all datastores (DB, CSV, Excel, and more). A new analysis option, the Value matcher, was added. With this analysis, it's easy to identify unexpected values in a field. Management of jobs, including copying and deleting jobs, has been made a lot easier by exposing the functionality directly in the UI. It has been made possible to change historic data quality metrics in order to reposition results into the timeline.

2012-01-03 11:15
2.4.1

이 릴리스에서 사소한 버그 수정, 성능 향상 및 몇 가지 새로운 기능을 추가합니다. 두 번 중요 한 것 들 가운데는 크게 향상 일괄 로드 성능, 주 창에서 편리 하 게 "쓰기 데이터" 메뉴 클릭 작업 구성 요소, 응용 프로그램을 시작할 때 Javascript 변압기 및 필터 및 잠재적인 교착 상태에 대 한 수정에 색칠 하는 구문 이름 바꾸기.
Tags: Minor feature enhancements, Minor bugfixes
This release adds minor bugfixes, performance improvements, and a few new features. Among the important ones are greatly-improved batch loading performance, a convenient "write data" menu in the main window, double-click renaming of job components, syntax coloring in the Javascript transformer and filter, and fixes for a potential deadlock when starting the application.

2011-12-15 07:54
2.4

읽기 및 쓰기 작업 모두에 대 한 MongoDB 데이터베이스에 대 한 지원. 구름에 고객 DQ 함수를 제공 하는 Easydq.com의 통합. 중복 감지 (일명. Deduplication / 유사 일치) 분석기. 테이블에서 여러 값의 조회를 하 고 "조회 테이블" 구성 요소입니다. 어떤 종류의 테이블 (예: 데이터베이스 테이블, CSV 파일, Excel 시트 또는 MongoDB 컬렉션)에 레코드를 삽입 하는 것에 대 한 "테이블에 삽입" 구성 요소입니다. 명령줄에서 계측 수는 parameterizable 작업에 대 한 허용 하는 작업 수준 변수입니다.
Tags: Major feature enhancements, mongodb, ETL, xml. lookup, customer data
Support for MongoDB databases, both for read and write operations. Integration with EasyDQ.com, which provides Customer DQ functions in the cloud. Duplicate detection (aka. Deduplication / Fuzzy matching) analyzers. A "Table lookup" component for doing lookups of multiple values from a table. An "Insert into table" component for inserting records into any kind of table (e.g. database tables, CSV files, Excel sheets, or MongoDB collections). Job-level variables which allow for parameterizable jobs that can be instrumented from the command line.

Project Resources